2024.04.27 (토)

  • 맑음속초22.6℃
  • 맑음28.4℃
  • 맑음철원26.7℃
  • 맑음동두천26.6℃
  • 맑음파주23.5℃
  • 맑음대관령23.3℃
  • 맑음춘천27.8℃
  • 구름조금백령도15.0℃
  • 맑음북강릉24.8℃
  • 맑음강릉27.1℃
  • 맑음동해22.0℃
  • 맑음서울24.8℃
  • 맑음인천20.2℃
  • 맑음원주26.5℃
  • 맑음울릉도19.6℃
  • 맑음수원22.0℃
  • 맑음영월26.8℃
  • 맑음충주26.6℃
  • 맑음서산22.5℃
  • 맑음울진20.2℃
  • 맑음청주26.3℃
  • 맑음대전26.7℃
  • 맑음추풍령26.1℃
  • 맑음안동28.2℃
  • 맑음상주28.2℃
  • 맑음포항25.2℃
  • 맑음군산19.4℃
  • 맑음대구29.9℃
  • 맑음전주24.1℃
  • 맑음울산21.0℃
  • 맑음창원23.7℃
  • 맑음광주26.8℃
  • 맑음부산19.8℃
  • 맑음통영20.5℃
  • 맑음목포20.2℃
  • 맑음여수21.9℃
  • 맑음흑산도16.0℃
  • 맑음완도26.6℃
  • 맑음고창21.8℃
  • 맑음순천27.1℃
  • 맑음홍성(예)24.1℃
  • 맑음24.9℃
  • 맑음제주22.1℃
  • 맑음고산18.1℃
  • 맑음성산20.4℃
  • 맑음서귀포21.6℃
  • 맑음진주27.1℃
  • 구름조금강화17.9℃
  • 맑음양평26.3℃
  • 맑음이천26.9℃
  • 맑음인제27.5℃
  • 맑음홍천27.6℃
  • 맑음태백25.6℃
  • 맑음정선군29.7℃
  • 맑음제천25.9℃
  • 맑음보은26.0℃
  • 맑음천안24.6℃
  • 맑음보령23.2℃
  • 맑음부여26.9℃
  • 맑음금산26.6℃
  • 맑음26.3℃
  • 맑음부안19.8℃
  • 맑음임실25.5℃
  • 맑음정읍24.1℃
  • 맑음남원27.4℃
  • 맑음장수26.2℃
  • 맑음고창군24.7℃
  • 맑음영광군21.2℃
  • 맑음김해시22.1℃
  • 맑음순창군26.0℃
  • 맑음북창원27.4℃
  • 맑음양산시25.8℃
  • 맑음보성군25.4℃
  • 맑음강진군26.8℃
  • 맑음장흥24.6℃
  • 맑음해남24.1℃
  • 맑음고흥25.8℃
  • 맑음의령군29.4℃
  • 맑음함양군29.7℃
  • 맑음광양시26.7℃
  • 맑음진도군21.1℃
  • 맑음봉화26.8℃
  • 맑음영주27.2℃
  • 맑음문경27.4℃
  • 맑음청송군29.1℃
  • 맑음영덕24.4℃
  • 맑음의성29.2℃
  • 맑음구미28.5℃
  • 맑음영천28.0℃
  • 맑음경주시26.9℃
  • 맑음거창29.3℃
  • 맑음합천28.2℃
  • 맑음밀양29.4℃
  • 맑음산청28.3℃
  • 맑음거제22.8℃
  • 맑음남해25.6℃
  • 맑음23.9℃
AI가 내 개인정보도 학습?…정부 “주요 식별정보 제거조치 미흡”
  • 해당된 기사를 공유합니다

스포츠종합

AI가 내 개인정보도 학습?…정부 “주요 식별정보 제거조치 미흡”

개인정보보호위원회 "주민등록번호, 신용카드 번호 등 중요 개인정보 포함될 가능성 조사"

20240328_zw7B4i.jpg

 

 

챗PGT 같은 대규모 언어모델(LLM) 기반의 인공지능(AI)이 데이터를 학습할 때 주민등록번호 같은 주요 식별정보를 제거하는 조치가 미흡하다는 조사 결과가 나왔다고 KBS 한국방송 신지수 기자가 전했다.

방송 보도에 따르면 개인정보보호위원회는 지난해 11월부터 지난 1월까지 약 3개월 동안 오픈AI와 구글, 네이버 등 6개 사업자가 제공하는 LLM 기반의 AI 서비스에 대한 사전 실태점검을 했다.

이들 서비스는 인터넷에 공개된 데이터를 수집해 AI 모델 학습 데이터로 사용하는데, 이 과정에서 주민등록번호, 신용카드 번호 같은 중요한 개인정보가 포함될 가능성이 있는 것으로 조사됐다.

개인정보위 조사 결과에 따르면 오픈AI와 구글, 메타는 개인정보가 많이 포함된 사이트는 AI 모델 학습에서 배제하고 있지만, 그 외 사이트에 포함된 주요 식별정보에 대한 제거 조치는 미흡한 것으로 파악됐다.

우리가 무심코 웹사이트에 개인정보를 올리면, 그 정보를 AI가 학습할 가능성이 있기 때문이다.

실제로 지난해 말 기준 2만 999개 페이지에 주민번호와 여권번호 등 민감한 개인정보가 노출돼있는 상황이라고 개인정보위는 밝혔다.

또, 이용자들은 자신의 정보가 AI 학습에 활용되지 않도록 막는 기능을 사이트에서 찾기 어렵고, AI 기능 개선을 위해 인력이 투입되고 있는 점도 제대로 고지되지 않고 있는 것으로 조사됐다.

업체들은 AI 모델이 정확한 답변을 하도록 다수의 인력을 투입하고 있는데, 이 과정에서 이용자들의 개인정보가 노출될 가능성이 있는데도 인력이 투입되고 있는 사실을 명확하게 알리지 않고 있던 ㄱ서이다.

개인정보위는 사전 학습 단계에서 주요 식별정보가 제거될 수 있도록 개인정보가 노출돼있는 2만여 개의 URL을 해당 사업자에게 제공해 학습에서 배제할 계획이다.

또 업체들이 AI 모델을 개선할 목적으로 이용자가 입력한 데이터에 대한 인적 검토를 할 경우, 사전에 식별정보를 제거하고 이용자에게 관련 사실을 명확히 고지하고, 이용자가 입력 데이터를 손쉽게 삭제할 수 있도록 접근성을 제고할 것을 권고했다.

[사진 = KBS 뉴스 화면 캡처]








모바일 버전으로 보기