진실과 거짓을 구별하는 문제는 아득한 옛날부터 인류의 숙제였다.

정확한 답을 얻기 어려운 문제였기 때문이다. 하지만 데이터의 영역에는 유용한 전략이 하나 있다.
바로 데이터가 어디에서 온 것인지, 
누가 데이터를 모았는지, 누가 보고했는지를 추궁하는 것이다.
또는 
내가 이 주제에 관한 기사에서 썼듯이, 데이터가 제시되었을 때 '누가 한 말인가?'라는 질문을 던지고 답을 요구해야 한다.데이터의 출처를 캐물으라는 말이다.
정보가 세상에 드러나지 않으면 정보의 진실성에 
관해 각자 나름의 결론을 내려버릴 수 있는 법이다.
(단 정보원에게 
위험이 있을지 모르는 일부 경우에는 해당되지 않는다). 

 

실질적인 면에서 보자면, 이 말은 모든 신문과 웹사이트, 모든 저자와 정치인이 정보를 어디서 얻었는지 말해야 한다는 뜻이다.
그래야 
우리가 확인해볼 수 있다.
적어도 시간과 마음만 있다면 확인할 수 
있다.
이 
전략이 모든 문제를 극복해내지는 못하겠지만(그걸 기대하는 것은 무리다), 그리고 누군가가 자기 입장을 지지하는 정보를 선택하는 것을 막지는 못하겠지만, 어쨌든 유용한 전략이다.

 

'투명성'은 종종 다크 데이터, 최소한 사기와 속임수 사례에서 발생하는 다크 데이터에 대한 부분적인 해답으로 부각된다.

투명성이라는 개념의 요지는 공개된 것은 어떻게 돌아가는지 알아보기 쉽다는 것이다.
사람들이 무슨 일이 벌어지는지 직접 볼 수 있으면, 사기 행위는 어려워진다.
서구 민주주의는 개방성을 
다양한 수준에서 매우 강조하며, 정부가 활동 내용을 자세히 발표하도록 권장한다.
예를 들어 영국의 
지방정부투명성법Local Government Transparency Code는 이렇게 말한다.

 

"투명성은 지방정부 책임성의 근본이며, 사회에서 큰 역할을 수행하도록 사람들에게 필요한 도구와 정보를 제공하는 데 핵심 요소다.
데이터의 
가용성은 또한 지방 기업, 자원봉사 및 공동체 분야들과 사회적 기업들이 서비스를 운영하거나 공공 자산을 관리하도록, 새로운 시장을 열어줄 수 있다.
(…) 정부는 원칙적으로 
특별히 민감한 경우를 제외하고 지방 당국이 관리하는 모든 데이터를, 지역민들이 이용할 수 있어야 한다고 믿는다." 또한 다음 내용을 덧붙인다. 

 

“이 법은 지역민들에게 중요한 사안에 관해 돈이 어떻게 지출되는지 (…) 자산의 사용 (…) 의사결정 (…) 등을 다루는 데이터를 지역민들이 열람하고 접속할 수 있도록 보장한다.”
이를테면 그레이트맨체스터의 
테임사이드 자치구의 경우 매 분기마다 500파운드를  초과하는 지출 항목의 내역이 공개된다.
이 내역에는 공급자, 매장, 상품/서비스의 
설명, 수량, 날짜, 기타 내용이 들어 있다.

 

하지만 개인적인 수준에서는 상황이 반대 방향으로 돌아가고 있는 듯하다.
사생활을 보호하는 방향, 또는 이렇게 표현할 수 있다면, 개인 데이터의 비밀주의 또는 숨김을 촉진하는 방향으로 말이다.
2018년 
5월 25일, 2장에서 언급한 유럽연합의 일반개인정보보호법GDPR이 시행되었다.
이 
법은 개인 데이터를 저장하고 사용하는 기관에게 의무를 부과하며, 개인들에게, 자신의 데이터가 어떻게 사용될지에 관한 높은 수준의 권리를 준다.
개인 데이터는 데이터로부터 식별할 
수 있는 살아 있는 개인과 관련된 데이터를 말한다.

 

GDPR은 기관에게 왜 데이터를 수집하고 사용하는지를 설명하라고 요구하며, 명확하고 자발적인 동의(또는 법적인 요건이라든가 누군가의 목숨을 구하기 위한 조치 같은 다른 정당한 사유)를 요구한다.
개인은 자신의 데이터에 접근할 권리를 가지며, 아울러 자신의 데이터를 수정하거나 삭제하거나 다른 데이터 관리자에게 옮길 권한도 갖는다.
또한 이런 종류의 법적 요구는, 다량의 개인 데이터를 처리하는 기업들에게 상당한 행정상의 부담을 안겨준다.

 

여담이지만 나는 투명성'이라는 단어를 사람들이 데이터 투명성을 놓고서 흔히 말하는 방식, 그러니까 '사람들이 데이터에 접근할 수 있음'을 가리킨다고 해석했다.
하지만 다른 관점도 존재한다. 우리가 
알아차리지 못해도 어떤 것을 통해서 다른 사물을 볼 수 있다면, 그것도 투명한 것에 해당한다.
예를 들어 유리창과 안경은 투명하다.

 

그리고 고통스러운 진실을 말하자면, 가장 효과적인 사기와 속임수 기법들 다수가 그런 개념에 바탕을 두고 있다.
우리가 보고 있지 
않아도 상황은 벌어지고 있으며, 모든 게 괜찮아 보인다.
단 우리가 
균열을 알아차리기 전까지는 말이다.
그런 다음에 모든 것이 무너져내린다.
이런 의미에서 
'투명성'은 데이터에 관한 한 '다크 데이터'와 불편한 유사성을 갖는다.

 

pp.276~278.

+ Recent posts