블록체인으로 이루는 데이터경제와 오라클 문제

KOK재단의 최영규 CTO가 B캐피탈리스트 6기 과정에서 블록체인으로 이루는 데이터 경제에 대한 강의를 했다.

문명의 도구들은 인간을 증강시켜왔다. 안경은 우리의 시력을 증강시키고 스마트폰은 우리의 인지력을 증강시켰다. 빅데이터와 인공지능(AI)는 인간에게 증강지능(Augmented Intelligence)을 갖게 하고 4D프린터와 나노기술의 융합은 증강된 장기를 인간에게 이식시켜준다.

사람은 증강인간(Augmented Human, AH)이 되어가고 있는 것이다. 우리의 환경 또한 많은 지능형 장치와 장비, 정보 및 연결기술, IoT와 로봇기술, 드론 등이 연결되어 더욱 똑똑해져가고 있다. 즉 증강인간과 지능형환경, 이 두 흐름의 경계는 점점 더 희미해지고 결국 합쳐져 진정한 사이버물리세계(CPW, Cyber-Physical World)가 다가오고 있다. 이 사이버물리세계에서 사이보그융합의 형태가 나타나고 있다.

이러한 미래를 형상화시키는 많은 미래기술들(Next Technologies)이 있는데 오늘 강의와 관련하여 특히 주목하고자 하는 기술은 AI, 합성생물 및 유전학, 지능증강, 4D프린팅, 인지, 블록체인 등이다.

기하급수의 시대 (Exponential Age)

변화의 관점에서 이 시대를 표현하면 ‘기하급수 시대(Exponential Age)’라 할 수 있다.  미래학자인 토마스 프레이가 말했듯이 우리가 앞으로 20년에 겪을 변화는 인류가 역사 이래 겪었던 모든 변화보다도 더 클 것이다. 리챠드 돕스는 그의 저서 ‘No Ordinary Disruption’에서 이 기하급수 시대는 과거의 산업혁명시대에 견주면 그 변화의 속도가 10배는 빠르고 그 스케일도 300배는 크며 사회전반에 주는 충격은 3000배는 될 것이다고 했다.

무엇이 이 기하급수 시대를 만들고 있을까?

그것은 영역파괴적 혁신과 융합을 가져오는 기하급수 기술과 그것에 의해서 점점 한계비용이 제로에 수렴하기 때문으로 보고 있다. 기하급수 기술은 NBICo라 불리는 Nano, Bio, Info, Cogno 기술들이 대표적이며 그것들이 디지털화되면서 6D 기하급수 프레임웍에 진입하기 때문이다.  일단 무언가가 디지털화하면 잠복기(Deceptive)를 거쳐 파괴적 혁신(Disruptive)이 일어나고 이어서 소멸화(Dematerialize), 무료화(Demonetize), 그리고 대중화(Democratize)의 성장곡선을 따라간다는 것이다. 

이러한 특성을 이해하고 적용하는 기업을 기하급수 기업, 사람을 기하급수 개인이라고 말할 수 있겠다. 기하급수 개인은 못되더라도 앨빈 토플러의 말처럼 21세기의 문맹은 글을 읽거나 쓸 줄 모르는 사람이 아니라 새로운 것을 배우지 못하는 사람인데 이 시대가 기하급수적 변화의 성격을 갖고 있음을 우리는 유념해야한다.

이러한 변화는 생물계에서 진행되어 기술시대에 들어오면서 유전정보가 디지털화되고 이것이 편집과 합성이 가능해지면서 Bio-Digital 융합이 가속화되고 있다.  융합으로 탄생되는 것을 우리는 BDO(Bio-Digital Organism)라 말하는데 이 BDO 또한 사이버물리세계에서 진화해갈 것이다. 디지털 형태로 인공지능이 주입되면서 이 BDO는 사이보그 융합형태로 나아갈 것이다.

새로운 데이터의 시대

위에서 살펴본 이 커다란 흐름의 핵심 소재가 데이터라는 데 주목하여야한다. 과학자들은 외계 우주에서 생명체가 있는 곳을 찾을 때 물이 그곳에 있는가 없는가를 먼저 살핀다고 한다. 물과 생명 – 이것은 필수 불가결한 관계이다. 데이터는 디지털 생태계(Digital Ecosystem)에 핵심 자양분인 셈이다.  데이터는 새로운 ‘물’이고 ‘생명’인 셈이다.

데이터가 ‘물’의 속성이 있다면 어떠한 물이어야 좋을까. 물은 흘러야하고 (Flow) 깨끗해야하며 (Clean) 갇혀있지 않아야(Free from Capture) 좋은 물일 것이다. 데이터에 적용한다면 그러한 데이터가 품질 좋은 데이터이다. 데이터는 인터넷과 온라인 상의 여러 계층의 하드웨어와 소프트웨어를 물처럼 잘 흘러갈 수 있어야 한다.  이것은 데이터의 모습이 서로 약속된 인터넷 표준 프로토콜을 잘 지킬 때 가능하다. 표준화된 데이터가 바로 물처럼 흐르는 데이터이다. 데이터의 표준을 W3C (World Wide Web Consortium)에서는 1998년에 XML (eXtensible Markup Language)로 잘 정의하였다.

데이터의 위조나 변조가 불가능하고 쉽게 공유될 수 있어서 숨기는 항목이 거의 사라지게 되면 이것은 깨끗한 데이터이다.  블록체인의 역할이 이 부분에 큰 도움이 될 것이다.

데이터가 자유롭다는 것은 응용 소프트웨어(SW)에 갇혀있지 않음을 뜻한다. 어떤 비표준 응용 SW가 그 데이터를 꼭 잡아서 처리해주어야만 그 안의 내용을 사람이나 기계가 볼 수 있다면 그러한 데이터는 그 응용 SW에 갇혀 있는 것이다. XML로 표현된 데이터는 다른 응용 SW의 도움없이 또는 다른 응용 SW를 위해 로컬로 다운로드할 필요없이 표준 웹브라우저만으로 어디에서나 자유롭게 볼 수 있고 처리할 수 있다. 이러한 데이터는 기계도 쉽게 인식할 수 있다.

품질이 좋은 데이터는 데이터 표준을 따르고 메타데이터를 갖고 있으며 데이터 공유 자산(Commons)이 될 수 있다.

4차산업혁명의 핵심에 데이터가 있다고 하는데 그냥 많은 데이터가 필요한 것이 아니라 국제 표준화된 데이터 기술에 의해 생성된 데이터이어야 가치가 있다. 이러한 데이터는 사람과 기계가 인식하기 쉽고 빅데이터, 클라우드, 인공지능, 블록체인, 보안 영역에 적용하기가 매우 쉽다. 인류가 생성하는 데이터들의 90% 정도가 비정형 데이터인데 이 비정형 데이터도 인공지능이 쉽게 인식하게 하도록 하는 것은 인공지능이 인간과 친화적, 공생적 방향으로 진전하는 데 매우 중요하다.  300개가 넘는 산업별 표준 또한 XML로 정의된 점을 고려한다면 XML로 표준화된 데이터의 생성과 활용이 필요해 보인다.

데이터 경제를 보는 3가지 관점

데이터 경제, 특히 블록체인으로 이루는 데이터 경제에서는 개인 데이터가 중요하다.  이러한 데이터에 대해서 세가지 다른 관점이 있다. 첫째, 데이터를 천연자원처럼(Data as Resource) 보는 것이다. 많은 플랫폼 기업들이 이 관점에서 데이터를 수집하고 분석, 해석/가공하면서 자신들의 기업활동이야말로 가치를 만든다고 주장한다.  둘째, 데이터의 생성을 개인의 노동의 결과(Data as Labor)로 보는 관점이 있다. 이 관점에서 ‘데이터 노동조합’도 만들어진 곳이 있고 머신러닝 방식에 의한 AI가 주목을 받으면서 이 관점도 힘을 받고 있다. 그러나 취미활동과 존재 자체로서 생성되는 데이터까지도 노동의 결과라고 보는데는 무리가 있다. 셋째, 데이터를 공동자산으로 (Data as Commons) 보는 관점이다. 개인에 의해 생성된 데이터는 이미 사회성이 있고 그 데이터들은 연결되어서 빅데이터 (Bigdata)형태로 2차적 ‘자연’을 형성한 것으로 간주하는 관점이다. 개인 데이터도 그 소유권에 있어서 개인과 사회라는 이중적 성격이 있다는 관점이다. 이 관점으로 스위스에서는 ‘마이데이터 협동조합’이 2015년에 구성되었고 경기도에서도 2019년에 ‘데이터배당시스템’이 구축되었다.

데이터 페르소나와 프로토콜로서의 블록체인

개인 데이터는 개인 인격의 발현으로 본다. 이것은 또 하나의 나인 ‘데이터 페르소나 (Data Persona)’라고 부를 수도 있겠다. OECD는 개인 데이터의 카테고리를 이용자 생성 콘텐츠, 활동 습관 데이터, 소셜 데이터, 위치 데이터, 인구학적 데이터, 그리고 공공행정 데이터로 구분한다. 이것을 좀 더 함축한다면 개인 데이터는 신원정보, 활동정보, 신체 건강 정보, 콘텐츠의 카테고리로 볼 수도 있겠다. 개인 데이터는 사이버물리세상에서의 데이터로서 공공데이터와 AI가 생성해내는 데이터 등과 함께 데이터 호수(Lake), 데이터 바다(Ocean)을 형성한다. 

블록체인은 프로토콜화 되고 있다. 신뢰의 프레임워크로서 블록체인은 새로운 경제층 (Economic Layer)를 형성해가고 있다. 이러한 블록체인의 성격을 BaaP(Blockchain as a Protocol)이라고 할 수 있겠다. 프로토콜로서의 블록체인이 만들어내는 경제가 프로토콜경제이다.

여기에 필요한 소재가 데이터인데 Data Lake, Data Ocean로 형성된 데이터는 공공자산처럼 보이지만 그 가치가 zero인 것은 아니다. 개인의 데이터는 블록체인에 의해서 구현된 개인데이터금고(PDV, Personal Data Vault)로 개인의 키와 스마트 컨트랙트만 관리될 수 있다. 이 PDV가 개인브라우저(Browser Persona – AI가 내장된 아바타 브라우저)에 연결되고 개인의 브라우저 페르소나는 월드와이드블록체인웹(WWBW)에 연결되어서 개인 데이터를 활용하여 수익을 창출할 수 있다. 개인이 자고 있는 동안에도 이 브라우저 페르소나는 소득을 창출해내고 있는 것이다. 희소성이 있는 개인 데이터 특히  신체 건강 데이터는 더 높은 소득을 창출할 수 있다. 이러한 것이 잘 운용될 때 기본소득(UBI, Universal Basic Income)도 먼 꿈만은 아닐 것이다.

데이터 오라클 이슈

그러나 당장 블록체인으로 이루는 데이터 경제 현실에서는 데이터 오라클 문제가 심각하다. 블록체인 바깥의 오프체인 데이터가 온체인 데이터로 바뀌기 위해서는 현실 세계와 블록체인의 중간에서 데이터를 블록체인 안에 넣어주는 사람이나 장치가 필요한데 그것이 데이터 오라클이다.

여기에서 그 중간자 역할을 하는 사람이나 장치를 어떻게 신뢰할 것인가 하는 문제가 생긴다. 오라클 문제는 하드웨어와 소스트웨어 영역에 모두 존재한다.  하드웨어 문제는 센서, IOT 디바이스, 내장형 디바이스 등의 오작동 문제이다. 소프트웨어 문제는 자료를 수집하는 봇의 실수나 의도적인 왜곡, 빅데이터 분석기 에러, 인공지능의 오류, 소프트웨어 버그, 해킹된 소프트웨어 등의 문제가 있다.

오라클 문제의 해결 방안으로는 온체인 입장에서 암호화폐 소유자들의 투표로 결정하거나 다양한 데이터의 중간값(Median)을 선택하거나 신뢰할 수 있는 데이터를 제공해주는 중간자 (Middleware)를 활용하는 3가지 방법이 있다. 이 오라클 문제가 완전히 해결되지는 못했으나 중간자 서비스 형태로서 이 문제를 해결해 주는 사업체들이 각광을 받고 있다. 그 중에서도 오라클라이즈(Oraclize, 현재 Provable로 개명)의 서비스가 활발한데 5가지의 기본 데이터 소스 유형과 3가지 메타 데이터 소스 유형에 대한 오라클 서비스를 제공한다. URL, WolframeAlpha 검색, IPFS 파일 내용, Random, Computation 등 5가지와 Nested, Identity, Decrypt 3가지다.

신종코로나바이러스 때문에 사이버물리세계로의 통합이 가속화되고있다. 블록체인으로 이루는 데이터 경제는 이 큰 흐름 속에서 보아야하고 이것 또한 디지털 생태계 안에 있으므로 데이터의 속성과 품질특성, 신뢰성이 중요하다. 온체인과 오프체인 사이에서는 이것이 데이터 오라클 문제로 정의되며 다양한 해결책이 개발되고있다.


KOK재단

KOK Play는 블록체인과 AI를 활용한 디지털 컨텐츠 플랫폼이고 크립토파이낸스 플랫폼이다. KOK재단이 발행한 토큰은 KOK이고 현재 ZBG와 빗썸글로벌에 상장되어있다. 최근 텐스페이스가 출시한 에이아이론(AILoan)에서는 KOK 토큰을 담보로 대출 서비스를 받을 수 있어 특히 젊은 층과 해외에서 큰 호응을 받고 있다.

최영규 CTO, KOK재단

- 크립토밸리랩 설립자
- NVIDIA 한국연구소 소장
- 삼성전자 SW연구소 상무
- B캐피탈리스트 6기 교수

댓글
읽어들이는 중...