내 프사가 범죄자 검색 AI에 사용된다고?

8분

2021.06.30.

3.5K

일반인 얼굴인식 AI, 어디까지가 불법일까

들어가기 전에:
유튜브가 얼굴 인식을 제한한다던데..

며칠 전, 유튜브 서비스 약관 업데이트 메일을 받았습니다. 그중 "얼굴 인식 제한"이라는 항목이 제 관심을 끌었습니다. 약관에 적힌 내용만 봐서는 도통 무슨 말인지 모르겠더라고요. 그래서 구글링을 시작했습니다.

유튜브는 작년 11월, "Clearview AI"라는 얼굴 인식 AI 스타트업이 유튜브의 영상과 이미지 자료를 스크랩하지 못하도록 해당 규제를 적용했습니다. 유튜브 같은 공룡 기업이 들어본 적도 없는 스타트업을 규제하겠다고 약관까지 업데이트하다니, 무슨 일인지 더욱 궁금해지기 시작했습니다.

Clearview AI에 관한 모든 것

Clearview AI는 경찰 등의 법 집행 기관에 얼굴 인식 기술을 제공해 범죄 수사를 돕는 IT 스타트업입니다.

Clearview AI의 서비스를 요약하자면,

1) 일반인 사진 30억 개를 인터넷, 범죄자 DB 등에서 수집해 누구든 인식할 수 있는 얼굴 인식 AI를 개발했습니다.

2) 수사 기관에서 범죄자로 추정되는 사람의 사진을 입력하면 그 사람의 얼굴과 일치하는 정보를 검색 결과로 제공해 수사에 도움을 줍니다.

수사 기관에서 Clearview AI의 서비스를 사용하는 과정을 조금 더 자세하게 풀자면 이렇습니다.

용의자의 사진을 Clearview AI 시스템에 업로드합니다.
Clearview AI가 해당 얼굴과 일치한다고 판단한 인물의 자료를 공개 웹 소스에서 가져옵니다. 해당 인물이 SNS 페이지에 업로드한 사진 등이 크롤링됩니다.
* Clearview는 검색 결과가 웹에 공개된 정보임을 강조합니다. 사용자가 비공개나 친구 공개로 설정한 이미지는 제공하지 않는다고 합니다.
조사관이 정보를 검토합니다. Clearview AI가 찾은 인물의 정보를 수사에 활용합니다.
최종 사용자는 Clearview에서 찾은 결과를 신중하게 검토해야 합니다. Clearview AI에게 오인식 등의 이슈가 있으나 결국 책임은 최종 사용자에게 있음을 명기한 것으로 보입니다.

정리하면, Clearview AI는 두 차례에 걸쳐 유튜브의 이미지를 수집합니다.Clearview AI는 위의 2번 단계에서 인물의 정보를 제공할 때 SNS 이미지를 크롤링해 가져옵니다. 또한, 인물의 얼굴을 인식하는 기술을 만들 때에도 SNS에서 일반인들의 얼굴 이미지를 수집할 것입니다.

Clearview AI는 30억 개 이상의 얼굴 이미지를 보유한 것으로 밝혔습니다. 한 사람당 적어도 10개의 이미지를 수집했다고 하면, 3억 명을 인식할 수 있을 만큼 어마어마한 양입니다. '20년 기준 미국 인구가 3.3억 명이므로 만약 미국인의 이미지만 수집했다면 대부분의 미국인의 사진을 보유했다고 볼 수 있습니다. (참고로 Clearview AI는 전 세계 27개국에서 서비스 중입니다.)

Clearview AI는 실제로 얼마나 사용되고 있나

'20년 3월 CNN 비즈니스 인터뷰에서 Clearview AI CEO는 free-trial 중인 기관을 포함해 600개가 넘는 기관에서 서비스를 사용한다고 답했습니다. 일부 금융 기관과 같은 개인 고객이 포함되어 있으나, 대부분은 수사 기관에서 사용한다는 애매한 답변을 곁들입니다.

Buzzfeed 뉴스는 27개국의 2,200개가 넘는 공공 기관에서 Clearview AI를 사용했으며, 이 솔루션으로 수십만 명의 얼굴을 검색했다고 밝혔습니다.

Clearview AI의 CEO는 사기꾼 출신?

Clearview AI 설립자 Hoan Ton-That (출처: CNN Business Youtube 영상)

Clearview AI의 설립자인 Hoan Ton-That은 호주 출신의 사업가로 Clearview AI를 만들기 전에 이미 수차례 애플리케이션을 출시한 이력이 있습니다. 흥미로운 사실은 ViddyHo와 fastforwarded.com라는 피싱 서비스를 만든 경력이 있다는 것인데요, 해당 서비스에 로그인하면 구글 계정 정보를 해킹하는 식으로 돈을 벌었다고 합니다.

과거의 피싱 서비스는 (다행히도) 모두 성공하지 못했으나 그는 2016년에 리처드 슈왈츠라는 정치인을 만나 얼굴 인식 AI를 개발하기 시작합니다. 그의 사업은 AI 시스템을 개발한 후 사용처를 찾은 케이스로, 개발 후에 그의 인물 인식 AI가 법 집행 기관에서 사용하기에 적합하다는 것을 깨달았다고 합니다.

30억 개에 달하는 얼굴 이미지를 수집하는 것은 엄청난 리소스를 필요로 합니다. 자체 플랫폼에 쌓인 데이터도 아닌데 말이죠. 사업 초기 자본을 어디에서 투자받아 이 정도로 방대한 데이터를 수집할 수 있었는지는 알려진 바가 없습니다.

Clearview AI가 논란이 된 이유

"당신의 SNS 프로필 사진, 휴가에서 찍은 사진, 가족사진 또한 얼굴 인식 수사망의 일부가 되어 전국의 법 집행관에 의해 사용될 수 있다." - Buzzfeed 기사 중

구글, 유튜브, 링크드인, 트위터 등 굴지의 IT 기업은 Clearview AI에게 자료 수집 정지 명령을 내렸습니다. 앞으로의 수집을 금지할 뿐만 아니라 지금껏 수집해온 자료도 삭제하라고 했지만, Clearview AI에게 사실상 사업을 접으라는 요구이니 말을 들을 리 만무합니다.

그런데 Clearview AI의 잘못은 어디까지인 걸까요? 타 SNS의 이미지를 AI 학습에만 사용했다면 문제가 없었을까요?

어디까지가 불법인가?

이러한 의문이 든 이유는 구글, 페이스북, 틱톡 등은 자사 플랫폼에 있는 사용자의 데이터를 무한정으로 수집하고 학습 데이터로 사용하기 때문입니다. 그렇게 개발한 AI로 사용자에게 맞춤형 콘텐츠나 광고를 추천하고 새로운 서비스를 만듭니다. 구글은 한 때 유행했던 "마네킹 챌린지 유튜브 영상"을 활용해 비디오의 depth를 추정하는 기술을 개발했다고 밝히기도 했습니다. Clearview AI가 고객의 데이터를 수집해 새로운 AI를 개발한 것이 불법이라면 대형 IT 기업들의 활동도 불법이라 봐야 하지 않을까요.

결국 Clearview AI의 문제는 개인의 SNS 이미지를 AI 학습을 위해서만 수집하지 않고 크롤링한 데이터를 검색 결과에 그대로 노출한다는 데에 있다고 보는 것 같습니다. 그런데 구글도 유사한 서비스를 제공하지 않나요? 구글에 특정인의 이름이나 아이디를 검색하면 그 사람이 SNS에 업로드한 글과 사진을 쉽게 찾을 수 있으니까요. Clearview AI 입장에선 구글과 같이 SNS에 공개된 정보를 크롤링한 것뿐인데 억울할 수 있겠네요.

Clearview AI와 구글의 차이는 자사 플랫폼의 데이터 사용 여부와 검색 방식에 있습니다. 검색 방식의 차이란, 특정 인물의 정보를 찾기 위해 이미지로 검색하는지, 이름으로 검색하는지의 차이를 뜻합니다. 저는 이 두 가지 차이가 구글은 합법이고, Clearview AI는 불법임을 가르는 기준이 될 수 있는지 의문입니다.

<의문 두 가지>

1) 구글에 업로드된 자료의 소유권은 구글에게 있는 것일까요? 그래서 구글은 플랫폼에 업로드된 자료를 AI 개발 등에 사용할 수 있으나 다른 플랫폼은 구글에 업로드된 자료를 활용하면 안 되는 걸까요? "개인 식별 정보"가 있는 데이터를 가져가는 것이 불법이라면 구글은 그 자료를 들고 있어도 된다는 근거는 무엇일까요?

2) 이미지로 검색하는 것이 이름으로 검색하는 것보다 소름 끼치긴 하지만 합법과 불법을 가르는 본질적인 차이라고 할 수 있을까요?

물론, Clearview AI에도 문제가 있습니다. 비즈니스 모델 자체가 민감한 데이터를 다루고 있으며, 다른 기업은 인물 데이터만을 중점적으로 사용하지 않기 때문입니다. 그러나 중요한 건 동일한 개인 정보 보안 이슈가 대형 IT 기업에도 분명히 존재한다는 것입니다.

여러 논란에도 잘 나가는 Clearview AI

개인 정보 수집 논란에도 불구, Time 지는 Clearview AI를 가장 2021년 가장 영향력 있는 100대 기업으로 선정했습니다.

그 이유는 Clearview AI가 수 천 개의 경찰 기관이 범죄 용의자를 특정하는 데 사용되었으며, 21년 초 미국 국회 의사당을 공격한 사람들의 신분을 밝히는 데에도 도움을 주었기 때문이라고 합니다.

마무리하며:
만약 우리나라였다면?

Clearview AI의 일반인 얼굴 인식 솔루션은 불법(개인 정보 침해)과 합법(국가의 수사 협조) 사이에서 아슬아슬한 줄타기를 하고 있습니다. 여기서 떠오르는 재미있는 생각, 만약 Clearview AI 같은 기업이 한국에 생긴다면 이만큼 큰 논란이 생겼을까요?

서비스가 범죄 수사에 도움이 된다면 국가 지정 솔루션이 되고, 국가가 정당성을 보장해주었을 거라 생각합니다. 실제로 범죄자를 잡는데 도움이 된 몇 가지 사례를 든다면 여론도 꽤 좋았을 것입니다. 어쨌든 분명 미국보단 옹호하는 사람의 비율이 더 높았으리라 생각합니다.

프라이버시보단 안전을 중요시하는 우리나라의 특성은 K-방역에서도 두드러졌는데요. Clearview AI가 국가의 감시 하에 수사 기관과 협조하고, 범죄 검거율을 높였다는 결과를 제시하면 프라이버시 이슈를 어느 정도 눈 감아주지 않았을까요. 개인주의 가치관이 두드러지는 서구권 국가는 프라이버시 침해에 민감하므로 Clearview AI의 논란이 더 크게 불거진 것으로 보입니다.

출처

Clearview AI에 자신을 검색 결과에서 제외해달라는 요청서를 작성할 수 있음 (캘리포니아 거주민 한정):

https://clearviewai.typeform.com/to/yc4rX9

들어가기 전에:유튜브가 얼굴 인식을 제한한다던데..