Friday, January 15, 2021

이루다 개인정보 노출

 지난 12일 운영을 중단한 인공지능 챗봇 ‘이루다’ 개발사 스캐터랩이 ‘연애의 과학’ 이용자들의 카톡 데이터 1700건이 외부에 유출된 것이 사실이라고 인정하고 사과했다.스캐터랩은 13일 밤 사과문을 내어 “개발팀이 2019년에 오픈소스 공유 플랫폼 깃허브에 공개한 내용에 내부 테스트 샘플(연애의 과학 대화 데이터)이 포함된 사실이 확인됐다”며 “데이터 관리에 더 신중하지 못했고, 일부 민감할 수 있는 정보가 포함된 대화 패턴이 노출된 점에 대해서 진심으로 사과한다”고 밝혔다. 이날 개발자 커뮤니티를 중심으로 스캐터랩이 비식별화 과정을 제대로 거치지 않은 연애의 과학 이용자들의 카카오톡 대화 데이터를 오픈소스 공유 플랫폼 깃허브에 공개했다는 논란이 불거졌는데 이 논란을 인정하고 사과한 것이다. 스캐터랩은 논란이 불거진지 5일 만에 정식으로 사과하면서 “개인정보보호위원회 및 한국인터넷진흥원(KISA)에서 진행 중인 조사에 성실히 임하겠다”고도 했다.

스캐터랩이 깃허브에 올린 것으로 알려진 대화 내용에는 “혈당을 잰다” “○○구청을 지난다” 등 대화 참여자들의 건강 상태나 거주 지역을 추정할 수 있는 내용이 그대로 포함되어 있었다. 깃허브는 전세계 개발자들이 인공지능 등 개발을 위한 재료를 공유하는 곳이다. 스캐터랩은 이날 논란이 불거지자 해당 데이터를 깃허브에서 비공개 처리했지만, 1년 넘는 기간 동안 공개된 상태로 있으면서 상당히 퍼졌을 것으로 추정된다.

이 외에도 스캐터랩은 이루다 개발을 위해 심리분석 앱 ‘연애의 과학’ 등 기존 스캐터랩 서비스 이용자들의 대화 데이터를 활용하면서 이들에게 인공지능 개발에 데이터가 활용될 수 있다는 점을 제대로 알리거나 동의받지 않고 민감정보가 포함됐을 가능성이 높은 정보들을 수집한 것 아니냐는 의심도 받고 있다. 또 이 정보들을 활용하면서 대화 상대방의 동의를 받지 않은 점도 비판의 대상이 되고 있다. 스캐터랩 사내에서 이용자들의 대화 내용을 돌려봤다는 전직 직원의 증언도 나온 상황이다.

이에 대해 회사 쪽은 “이번 사안에 대하여 깊은 책임감을 느끼고 있다”며 “발전해나가는 인공지능 윤리에 관한 사회적 합의에 보다 부합할 수 있도록 지속적으로 가다듬어, 인공지능을 연구하는 다른 기업들의 모범이 될 수 있는 기업이 되도록 노력하겠다”고 말했다.

No comments:

Post a Comment