2024.04.28 (일)

  • 흐림속초13.4℃
  • 구름많음19.7℃
  • 흐림철원17.2℃
  • 구름많음동두천19.5℃
  • 구름많음파주17.4℃
  • 흐림대관령9.3℃
  • 흐림춘천18.8℃
  • 흐림백령도12.0℃
  • 흐림북강릉13.1℃
  • 흐림강릉14.1℃
  • 흐림동해13.2℃
  • 구름많음서울21.6℃
  • 흐림인천18.5℃
  • 구름조금원주20.8℃
  • 박무울릉도15.4℃
  • 구름많음수원17.8℃
  • 맑음영월19.1℃
  • 구름많음충주18.5℃
  • 흐림서산16.9℃
  • 구름많음울진13.4℃
  • 흐림청주24.0℃
  • 구름많음대전22.0℃
  • 구름조금추풍령20.1℃
  • 구름많음안동18.5℃
  • 구름많음상주21.2℃
  • 구름많음포항15.2℃
  • 구름많음군산15.5℃
  • 흐림대구17.1℃
  • 구름많음전주20.0℃
  • 구름많음울산15.0℃
  • 구름많음창원17.5℃
  • 구름많음광주21.5℃
  • 흐림부산16.5℃
  • 흐림통영17.4℃
  • 흐림목포17.5℃
  • 흐림여수17.7℃
  • 흐림흑산도15.4℃
  • 흐림완도18.3℃
  • 흐림고창16.9℃
  • 흐림순천15.7℃
  • 흐림홍성(예)18.8℃
  • 흐림18.7℃
  • 비제주19.3℃
  • 흐림고산17.9℃
  • 흐림성산19.5℃
  • 흐림서귀포21.1℃
  • 흐림진주16.8℃
  • 흐림강화15.9℃
  • 구름조금양평19.1℃
  • 구름조금이천19.5℃
  • 흐림인제14.4℃
  • 구름많음홍천18.6℃
  • 구름조금태백11.4℃
  • 구름많음정선군15.1℃
  • 구름조금제천17.3℃
  • 흐림보은18.6℃
  • 흐림천안18.4℃
  • 구름많음보령14.9℃
  • 구름조금부여18.7℃
  • 구름많음금산18.6℃
  • 구름많음21.1℃
  • 구름많음부안15.5℃
  • 구름많음임실17.5℃
  • 흐림정읍17.8℃
  • 흐림남원20.0℃
  • 구름많음장수16.8℃
  • 흐림고창군17.4℃
  • 흐림영광군17.4℃
  • 흐림김해시17.7℃
  • 구름많음순창군19.4℃
  • 흐림북창원19.0℃
  • 구름많음양산시18.9℃
  • 흐림보성군18.0℃
  • 흐림강진군19.4℃
  • 흐림장흥18.4℃
  • 흐림해남19.2℃
  • 흐림고흥18.0℃
  • 구름많음의령군17.7℃
  • 구름많음함양군18.1℃
  • 흐림광양시18.4℃
  • 흐림진도군17.9℃
  • 구름조금봉화17.7℃
  • 구름조금영주17.9℃
  • 흐림문경19.8℃
  • 구름많음청송군14.7℃
  • 구름많음영덕13.6℃
  • 구름많음의성19.6℃
  • 구름조금구미21.4℃
  • 구름많음영천14.4℃
  • 구름많음경주시14.7℃
  • 흐림거창18.2℃
  • 구름많음합천20.6℃
  • 구름많음밀양19.9℃
  • 흐림산청20.1℃
  • 흐림거제17.2℃
  • 흐림남해17.2℃
  • 흐림17.9℃
AI가 내 개인정보도 학습?…정부 “주요 식별정보 제거조치 미흡”
  • 해당된 기사를 공유합니다

뉴스종합

AI가 내 개인정보도 학습?…정부 “주요 식별정보 제거조치 미흡”

개인정보보호위원회 "주민등록번호, 신용카드 번호 등 중요 개인정보 포함될 가능성 조사"

20240328_zw7B4i.jpg

 

 

챗PGT 같은 대규모 언어모델(LLM) 기반의 인공지능(AI)이 데이터를 학습할 때 주민등록번호 같은 주요 식별정보를 제거하는 조치가 미흡하다는 조사 결과가 나왔다고 KBS 한국방송 신지수 기자가 전했다.

방송 보도에 따르면 개인정보보호위원회는 지난해 11월부터 지난 1월까지 약 3개월 동안 오픈AI와 구글, 네이버 등 6개 사업자가 제공하는 LLM 기반의 AI 서비스에 대한 사전 실태점검을 했다.

이들 서비스는 인터넷에 공개된 데이터를 수집해 AI 모델 학습 데이터로 사용하는데, 이 과정에서 주민등록번호, 신용카드 번호 같은 중요한 개인정보가 포함될 가능성이 있는 것으로 조사됐다.

개인정보위 조사 결과에 따르면 오픈AI와 구글, 메타는 개인정보가 많이 포함된 사이트는 AI 모델 학습에서 배제하고 있지만, 그 외 사이트에 포함된 주요 식별정보에 대한 제거 조치는 미흡한 것으로 파악됐다.

우리가 무심코 웹사이트에 개인정보를 올리면, 그 정보를 AI가 학습할 가능성이 있기 때문이다.

실제로 지난해 말 기준 2만 999개 페이지에 주민번호와 여권번호 등 민감한 개인정보가 노출돼있는 상황이라고 개인정보위는 밝혔다.

또, 이용자들은 자신의 정보가 AI 학습에 활용되지 않도록 막는 기능을 사이트에서 찾기 어렵고, AI 기능 개선을 위해 인력이 투입되고 있는 점도 제대로 고지되지 않고 있는 것으로 조사됐다.

업체들은 AI 모델이 정확한 답변을 하도록 다수의 인력을 투입하고 있는데, 이 과정에서 이용자들의 개인정보가 노출될 가능성이 있는데도 인력이 투입되고 있는 사실을 명확하게 알리지 않고 있던 ㄱ서이다.

개인정보위는 사전 학습 단계에서 주요 식별정보가 제거될 수 있도록 개인정보가 노출돼있는 2만여 개의 URL을 해당 사업자에게 제공해 학습에서 배제할 계획이다.

또 업체들이 AI 모델을 개선할 목적으로 이용자가 입력한 데이터에 대한 인적 검토를 할 경우, 사전에 식별정보를 제거하고 이용자에게 관련 사실을 명확히 고지하고, 이용자가 입력 데이터를 손쉽게 삭제할 수 있도록 접근성을 제고할 것을 권고했다.

[사진 = KBS 뉴스 화면 캡처]








모바일 버전으로 보기