기사가 ChatGPT로 작성되었는지 확인하는 방법

0
166

기사가 ChatGPT로 작성되었는지 확인하는 방법
Hannah Stryker / 하우투 긱
단순하고 반복적인 구조와 논리적이고 사실적인 오류를 만드는 경향으로 ChatGPT로 작성된 기사를 알 수 있습니다. 일부 도구는 AI가 생성한 텍스트를 자동으로 감지하는 데 사용할 수 있지만 오탐이 발생하기 쉽습니다.

AI 기술은 우리가 온라인에서 보는 것과 세상과 상호 작용하는 방식을 변화시키고 있습니다. 패딩 코트를 입은 교황의 여정 중 사진에서 ChatGPT와 같은 언어 학습 모델에 이르기까지 인공 지능은 우리 삶에 영향을 미치고 있습니다.

가짜 기사를 폭파하는 정치적 허위 정보 캠페인과 같이 AI 기술을 더 불길하게 사용할수록 가짜 기사를 식별할 수 있을 만큼 충분히 교육해야 합니다. 그렇다면 기사가 실제로 AI 생성 텍스트인지 어떻게 알 수 있습니까?

ChatGPT가 해당 기사를 작성했는지 확인하는 방법

현재 읽고 있는 기사가 로봇에 의해 작성되었는지 확인하는 데 도움이 되는 여러 가지 방법과 도구가 있습니다. 그들 모두가 100% 신뢰할 수 있는 것은 아니며 거짓 긍정을 제공할 수 있지만 출발점을 제공합니다.

적어도 현재로서는 사람이 쓴 텍스트의 큰 특징 중 하나는 무작위성입니다. 사람들은 다양한 스타일과 속어를 사용하여 글을 쓰고 종종 오타를 범하지만, AI 언어 모델은 그런 종류의 실수를 거의 하지 않습니다. MIT Technology Review에 따르면 “사람이 쓴 텍스트는 오타가 많고 매우 가변적”인 반면 ChatGPT와 같은 AI 생성 텍스트 모델은 오타가 적은 텍스트를 만드는 데 훨씬 뛰어납니다. 물론 좋은 카피 에디터도 같은 효과를 낼 수 있으므로 올바른 철자 이상을 살펴봐야 합니다.

또 다른 지표는 구두점 패턴입니다. 인간은 AI 모델보다 구두점을 더 무작위로 사용합니다. 또한 AI 생성 텍스트에는 일반적으로 거의 사용되지 않는 큰 단어 대신 “the”, “it” 또는 “is”와 같은 연결 단어가 더 많이 포함됩니다. 인간이 할 수있는 방식으로 좋게 들릴 것입니다.

이는 OpenAI 웹사이트의 주식 질문 중 하나에 대한 ChatGPT의 응답에서 볼 수 있습니다. “양자 컴퓨팅을 간단한 용어로 설명할 수 있습니까?”라고 물으면 “큐비트를 특별하게 만드는 것은 중첩이라는 속성 덕분에 큐비트가 동시에 여러 상태로 존재할 수 있다는 것입니다. 큐비트가 동시에 0과 1이 될 수 있는 것과 같습니다. ”

"간단한 용어로 양자 컴퓨팅을 설명할 수 있습니까?"라는 질문에 답하는 Chat GPT

짧고 간단한 연결 단어가 정기적으로 사용되며 문장의 길이는 모두 비슷하고 단락은 모두 비슷한 구조를 따릅니다. 최종 결과는 약간 로봇처럼 들리고 느껴지는 글쓰기입니다.

AI를 사용하여 AI 생성 텍스트를 감지할 수 있습니까?

대규모 언어 모델 자체는 AI가 생성한 글을 발견하도록 훈련될 수 있습니다. 하나는 AI가 작성하고 다른 하나는 사람이 작성하는 두 가지 텍스트 세트로 시스템을 교육하면 이론적으로 모델이 ChatGPT와 같은 AI 작성을 인식하고 감지하도록 가르칠 수 있습니다.

연구원들은 또한 AI 기사와 텍스트를 감지하기 위한 워터마킹 방법을 연구하고 있습니다. 메릴랜드 대학에서 컴퓨터 과학을 가르치는 Tom Goldstein은 AI 언어 모델에 워터마크를 구축하는 방법을 연구하고 있습니다. 인간의 임의성을 모방하기에 충분하더라도 기계 생성 글을 감지하는 데 도움이 될 수 있기를 바랍니다.

육안으로 볼 수 없는 워터마크는 알고리즘으로 감지할 수 있으며, 워터마크 규칙을 준수하거나 위반하는 빈도에 따라 사람 또는 AI가 생성한 것으로 표시됩니다. 불행하게도, 이 방법은 ChatGPT의 최신 모델에서 그렇게 잘 테스트되지 않았습니다.

기사가 ChatGPT에 의해 작성되었는지 확인하는 도구

기사가 AI로 생성되었는지 확인하는 데 도움이 되는 여러 복사 및 붙여넣기 도구를 온라인에서 찾을 수 있습니다. 그들 중 다수는 언어 모델을 사용하여 ChatGPT-4 자체를 포함하여 텍스트를 스캔합니다.

예를 들어 감지할 수 없는 AI는 사용자의 AI 쓰기를 인간의 쓰기와 구분할 수 없게 만드는 도구로 자신을 홍보합니다. 텍스트를 복사하여 창에 붙여넣으면 프로그램이 GPTZero와 같은 다른 AI 감지 도구의 결과와 비교하여 우도 점수를 할당합니다. 기본적으로 8개의 다른 AI 감지기가 텍스트가 로봇에 의해 쓰여졌다고 생각하는지 여부를 확인합니다.

독창성은 대규모 게시자와 콘텐츠 제작자를 위한 또 다른 도구입니다. 시중의 다른 제품보다 더 정확하다고 주장하며 ChatGPT-4를 사용하여 AI가 작성한 텍스트를 감지합니다. 기타 널리 사용되는 확인 도구는 다음과 같습니다.

  • 지피티제로
  • 카피리크
  • 작가

이러한 도구의 대부분은 텍스트가 사람에 의해 작성되었을 가능성을 결정하기 위해 96% 인간 및 4% AI와 같은 백분율 값을 제공합니다. 점수가 40-50% AI 이상이라면 해당 작품이 AI로 생성되었을 가능성이 높습니다.

개발자가 AI 생성 텍스트를 더 잘 감지할 수 있도록 이러한 도구를 만들기 위해 노력하고 있지만 그 중 어느 것도 완전히 정확하지 않으며 사람의 콘텐츠를 AI 생성으로 잘못 표시할 수 있습니다. GPT-4와 같은 대규모 언어 모델이 너무 빨리 개선되고 있기 때문에 탐지 모델이 지속적으로 따라잡는다는 우려도 있습니다.

AI를 잡기 위해 두뇌 훈련

도구를 사용하는 것 외에도 AI 생성 콘텐츠를 포착하도록 스스로 훈련할 수 있습니다. 연습이 필요하지만 시간이 지나면 더 잘할 수 있습니다.

Google AI 사업부 Google Brain의 선임 연구 과학자인 Daphne Ippolito는 문장이 제대로 보이지 않을 때 알아차리도록 점진적으로 훈련함으로써 사람의 문장과 로봇 문장을 구분하는 데 도움이 되는 ROFT(Real Or Fake Text)라는 게임을 만들었습니다. .

Ippolito에 따르면 AI 텍스트의 일반적인 마커 중 하나는 “커피 한 잔을 만드는 데 2시간이 걸립니다.”와 같은 무의미한 진술입니다. Ippolito의 게임은 주로 사람들이 이러한 종류의 오류를 감지하도록 돕는 데 중점을 둡니다. 사실 AI 작성 프로그램이 전적으로 자신 있게 부정확한 사실을 언급하는 사례가 여러 번 있었습니다. 수학 과제를 수행하도록 요청해서는 안 됩니다. 수치 계산을 잘 처리하지 못하는 것 같기 때문입니다.

현재 AI 프로그램이 작성한 텍스트를 포착하는 데 필요한 최고의 감지 방법입니다. 언어 모델은 현재 감지 방법을 매우 빠르게 구식으로 만드는 속도로 개선되고 있지만 Melissa Heikkilä가 군비 경쟁인 MIT Technology Review에 글을 쓴 것처럼 우리를 남겨두고 있습니다.

관련된: Bing AI Chat으로 ChatGPT 사실 확인하는 방법