노동으로서의 데이터

일본의 젊은 경제학자이자 AI 연구자 이노우에 도모히로는 2045년쯤에는 '실속 있는 직업으로 먹고살 만큼 수입을 얻는 사람은 인구의 10퍼센트 정도에 불과할 것이라고 말했다.' 지금 사람들은 자기의 일자리가 없어지거나 사라질 수 있는 위험을 감수하면서 데이터를 제공해 인공지능의 혁신에 기여한느 셈이다. 데이터를 노동으로 여기는 관점은 이런 점을 강조한다. 인공지능 혁신과 디지털 경제 발전을 위해서라도 일자리 감소와 소득 감소에 대한 대책이 절실하게 필요로 한다. 데이터 생성에 참여한 개별 노동에는 적절한 보상이 돌아가야 한다. 그래서 사람들이 양과 질에서 더 나은 데이터를 공급하기 위해 지속적으로 노력할 것이고, 또 데이터에 기반한 경제도 꾸준하게 성장할 가능성이 높다.노동으로서의 데이터를 보는 관점은 데이터 소유권이 개인에게 있다고 강조한다. 물론 데이터를 가공하는 기업들의 역할이나 기여를 인정하지만, 데이터를 이용해도 되는지 개인으로부터 명확하게 절차를 따라 권한을 위임받고 나서야 기업의 역할은 이루어질 수 있다고 본다. 데이터를 노동으로 보는 관점은 개인이 기업에게 데이터를 제공한 후에도 데이터에 대한 최종적인 통제권은 물론 데이터 이용으로 창출된 수익에 대해 수익권을 가진다고 본다. 상업적인 목적으로 데이터를 수지비, 분석, 가공하는 플랫폼 기업과 여타 기없들은 데이터를 제공하는 개인에게 보상할 의무를 가진다고 본다. 글렌 웨일은 데이터 노동이 인정된다면 '연소득의 10퍼센트 정도는 개인 정보 노동의 대가로 얻게 될 것'이라고 추정한다. 그런데 '천연자원으로서 데이터' 관점은 '노동으로서의 데이터' 관점을 이렇게 비판한다. 데이터는 차고 넘치지만 정작 중요한 것은 데이터 해석 능력과 연산 능력이다. 사람들의 데이터 자체에사 가치가 창출되는 것이 아니라, 기업이 데이터를 수집하여 가공하고 해석하는 과정에서 가치가 창출된다는 것이다. 그렇다면 개인들의 데이터 제공에 대한 보상은 이메일이나 SNS 계정 등의 기본적이 무료 서비스를 제공하는 정도면 충분하다. 데이터는 '빅데이터'로 모아놓으면 가치가 높아지지만 개개인의 디ㅔ이터는 별 가치가 없다라는 주장을 한다. 하지만 '노동으로서의 데이터' 관점은 이러한 주장을 재반박한다. 머신러닝 방법의 등장과 함께 개별 데이터의 가치도 바뀌었기 때문이다. 많은 데이터를 수집하는 경우 하나하나의 개별 데이터는 큰 가치가 없다는 주장은 머신러닝 이전에는 어느 정도 일리가 있었다. 하지만 만약 10만 가구가 사는 지역의 평균 소득을 측정한다고 가정을 하자. 표본을 10가구 정도 모아서 측정에 신뢰성이 부여되기 힘들다. 일정한 규모가 되기까지는 개별 데이터 하나하나가 중요하므로 가치가 높다. 가구 표본을 1,000가구 정도 모았다면, 그 데이터에서 도출한 평균 소득은 상대적으로 신뢰할 만한 결론이 된다. 그렇다면 그 뒤에 추가되는 데이터는 결론의 정확도를 미세하게 높일 수는 있지만 결론의 질적 차이를 가져오지는 않는다. 1,000가구로 평균을 내나 1,010가구로 평균을 내나 비슷할 것이기 때문이다. 1,000가구의 데이터로 지역의 연평균 소득이 5,000만 원이라는 결론을 도출했다면, 1010가구의 데이터로 평균 소득이 5,500 만 원이라는 결론이 나오더라도 그다지 별 근 의미가 있지는 않다라는 말이다. 어느 정도 표본 규모에 이르기 까지는 개별 데이터의 가치가 올라가지만, 그 이상 넘어가게 되면 데이터 가치는 차이가 없다는 것이다. 데이터의 '하계가치 체감'이 나타나는 것이다. 하지만 이는 머신러닝 방법 이전의 현상이다. 머신러닝에서는 데이터가 쌓이면 쌓일수록 인공지능에게 질적으로 수준 높은 과제를 학습시킬 수 있다. 예를 들어 기계 시각의 경우, 데이터가 충분히 쌓이면 인공지능은 인간을 다른 사물로부터 구별할 수 있다. 데이터를 더 제공해주면 능력은 더 정밀해져서 사물 각각을 구분해내는 단계로 발전한다. 고차원적 능력으로 나아가는 것이다. 데이터 축적의 결과 인공지능이 사물 각각을 구분해내게 되면 이제 행동을 이해하는 단계로 넘어간다. 개와 고양이를 구분하는 정도를 넘어 달리는 개와 걸어 다니는 개, 또 애교를 부리는 개와 경계하는 개를 구분하는 훨씬 더 어려운 과제에 도전하는 것이다. 이 단계를 통과하면 기계 시각은 사물을 파악하는 정도를 넘어 현장에서 벌어지는 행위의 의미를 이해하고 대처할 수 있게 된다. 이는 인공지능 기반 서비스를 획기적으로 발전시킨다. 예를 들어 창고 경비 로봇은 자기에게 접근하는 인각이 창고를 털려는 행동인지 길을 물어보려는 행동인지를 표정과 태도를 보고 판단하여 대비함으로써 훨씬 더 유능하게 업무를 수행할 수 있을 것이다. 이런 인식 작업은 고도의 정확도가 필요하다. 데이터를 통해 평균 소득을 측정할 때의 정확도 90퍼센트 정도면 충분하다고 할수도 있다. 하지만 도심에서 운전하는 로봇 자동차가 사물은 90퍼센트 정도 인식한다면 승객을 태워도 충분하다고 이야기할 수 있을까? 인공지능 기반 서비스의 정확도를 높일수록 서비스 가치가 커진다. 개별 데이터가 하나라도 더 쌓여야 그 정확도를 단계별로 개선해나갈 수 있다. 그러므로 머신러닝에서 개별 데이터의 한계가치는 계속 증가한다. 데이터가 쌓일수록 더 어려운 과제 수행을 인공지능에게 학습시킬 수 있고 더 복잡한 서비스를 만들어 낼수가 있다. 데이터 노동을 강조하는 입장에서는 필요하다면 '데이터 노동조합'을 만들어야 한다고 말을 한다. 거대 기술기업은 수요 독점을 이용해 데이터를 공급하는 사람들의 임금을 0으로 묶어두고 있다. 전 세계 데이터 노동자들이 단결하고 데이터 노동운동에 뛰어들어야 하는 시점이 온다고도 말을 한다. 이미 그 시점이 왔는지도 모른다. 2018년 유튜브가 기업 약관을 동의 없이 변경해 일부 유튜버들의 생계에 피해를 주자 화가 난 독일 유튜버들은 노동조합을 조직했다. 유튜버 노동조합은 1년 만에 1만 6,000여 명의 회원을 모집했다.

저작자표시 비영리

'디지털 경제' 카테고리의 다른 글

데이터 거래 플랫폼 (0)	2020.07.04
데이터는 개인자산이자 공공 자산이다. (0)	2020.07.03
데이터 시장은 어때야 하나? (0)	2020.07.01
데이터 경제. 안전한가? (0)	2020.06.30
데이터의 중요성 (0)	2020.06.29