지난 4월 1일 팔란티어 CTO가 심오한 트윗 하나를 남겼다. "언어는 지식이 아니다"라고 말이다. 그리고 앞으로 이 세상의 기업은 2가지 부류로 나뉘게 될 것 같다는 생각이 든다. 이 말을 이해한 기업과 이해하지 못한 기업으로.. 이 의견에 대해 정리해봤다.
언어는 지식이 아니다
"언어는 지식이 아니다"라는 말을 바꿔서 표현하자면 "언어는 수학적으로 완벽하지 않다"라고 말할 수 있다. 이게 뭔 개소리냐? 예를 들어
A: 서울부터 부산까지 몇 킬로미터인지 말해줘
B: 100킬로미터입니다.
정상적인 대화처럼 보이지만 사실 수학적으로는 엉터리다. 왜냐하면, 서울의 어느 지점부터 부산의 어느 지점까지라는 것을 정의하지 않았기 때문이다. 기준점에 따라서 수치는 달라지니 말이다. 게다가 서울부터 부산까지 직선 거리인지 고속도로인지 국도인지에 따라 거리는 또 달라진다.
참고로 서울부터 부산까지 직선거리는 320km다. 그렇다면 위 대화는 질문도 대답도 모두 수학적으로 엉터리가 됨. 불완전한 지식이다.
또 하나의 예시로
A: 지금 어디에 있어?
B: 강남역 5번 출구 근처야
친구 사이에서 흔한 대화인데 사실 이 대화의 정보만으로는 절대로 친구를 찾을 수가 없다, 근처라는 말이 수학적 정보가 아닌 주관적 표현이기 때문임. 친구에게 정확한 정보를 주려면 이렇게 말해야 한다. "강남역 5번 출구 경도 126, 위도 37에 있어 라고 말이다.
그런데 실제 이렇게 대화를 하면 괴짜들이고.. 강남역 5번 출구라는 정보만 있다면 눈으로 보고 직접 친구를 찾는다. 그러나 이것을 반대로 생각하면 언어가 주는 정보가 완벽하지 않기 때문에, 눈으로 시각적 정보를 사용하는 것이기도 하다. 만일 눈이 보이지 않는 상태로 간다면 강남역 5번 출구 근처만큼 불완전한 정보도 없음.
그래서 언어는 지식이라 할 수 없다. 단지 표현들의 조합일 뿐. 이것을 전제로 두고 chatGPT에 대해서 살펴보자.
chatGPT의 한계
챗GPT 인공지능의 언어 생성 방식은 통계적인 확률 접근을 통해 이루어진다. 예를 들어
나는 학교에 OO까지 문장이 있다면 뒤에 나올 수많은 표현들 중
- 갔다
- 안간다
- 가고 싶었다
- 가는데 사고가 났다
1번 표현이 통계적으로 가장 많이 쓰이고 있으니 1번을 채택해서 학교에 갔다로 완성하는 방식이라 할 수 있다. 그렇기 때문에 GPT에게 수학적인 질문을 하면 오히려 엉터리로 대답하는 경우가 종종 있음. 예를 들어 5의 73 제곱 같은 흔치 않은 수식에 대한 질문하면 이런 수에 대한 언어적 표현이 거의 쓰인 적이 없기 때문에 통계적으로 찾지를 못해 대답을 자기 마음대로 숫자를 만들어 버림.
GPT가 문장 표현을 자연스럽게 만드는 능력은 뛰어나지만, 수학적인 이해도는 없기 때문이다. 그런데 불과 몇 개월 사이에 이러한 문제들에 해결되기 시작함. 수학적인 질문을 하면 GPT 자신이 판단하는 게 아니라, 외부 프로그램을 이용해서 나온 결과값을 읽어주는 방식으로 업그레이드됨.
내부 프로그램의 수학적 언어와도 접점이 생긴 것인데 이러면 어떤 일이 생기느냐? 최근에 GPT 플러그인이라는 플랫폼이 발표됐다.
GPT 플러그인은 GPT 인공지능이 직접 이용할 수 있는 프로그램인데. 만일 쿠팡 같은 쇼핑하는 앱이 목록에 있다면 "내 지성피부에 맞는 로션 구매해놔" 이렇게 GPT에게 말했을 때 GPT가 로션들을 찾은 후에 쇼핑 앱을 직접 이용해서 로션 구매까지 이어지는 상황이 가능해진 것이다.
직원이 회사에서 일을 한다는 것은 생산성을 창출한다는 뜻과 같은데, 현대 사회에서 대부분의 직원들은 컴퓨터 프로그램을 이용해서 생산성을 창출한다. 그런데 이 과정이 GPT가 플러그인들을 통해 결과를 도출해 내는 과정과 똑같음.
그렇다면 기업들은 당연히 앞다투어 GPT를 사용하려 할 거다. 좀 더 정확히 표현하면 사람들의 지능을 사용하려 하지 않고 마이크로소프트사의 인공지능을 우선적으로 사용하려고 하게 됨. 그럼 마소가 인공지능 시장을 씹어먹을까? 그렇지 않다.
사람은 사람 사이에서 완전하지 않은 사람의 언어로 소통한다. 그리고 이들이 집단을 이룬다. 집단이 되면 구성원들 사이에서는 자신들만의 또 다른 암묵적인 언어를 만들어 쓴다. 그래서 집단 같이 집단 사이에서는 더욱더 불완전한 언어로 소통한다.
예를 들어 디자이너 집단과 개발자 집단의 소통이 원활히 되지 않는다는 것이 대표적인 예다. 기업이란 바로 각자의 언어를 사용하는 각각의 집단들을 한데 모아둔 하나의 개체와 같음. chatGPT가 기업에 이용될 경우 각자의 영역에서 각각의 플러그인 프로그램들을 만나 최고의 성능을 발휘하게 되겠지만,
기업 전체의 관점에서 볼 때 챗GPT로 통합이 되는 것은 매우 어려운 일이다. 서두에서 말한대로 언어 인공지능일 뿐이며 수학적 언어와 만날 때 제대로 능력을 발휘하게 되는 기업은 인간의 언어로 이루어져 있는 조직이기 때문이다.
수학적 언어로 이루어진 팔란티어
GPT와 같은 언어 인공지능이 수학적 언어로 이루진 플러그인 프로그램 하나만 연동되어도 말도 안 되는 성능을 발휘하는데 하나의 수학적 언어로 이루어진 기업이 있다면? 그리고 그로 인해 기업이 통합 OS화가 된 프로그램의 형태를 이루고 있다면,
이러한 기업이 언어 인공지능과 만나게 된다면 이후에 벌어질 일들이 상상조차 어렵다. 현실에 있는 예를 들자면, 내연기관 자동차와 테슬라가 단적인 예로 들 수 있다.
이 둘의 가장 큰 차이는 바로 통합 OS의 유무. 기존의 자동차는 반도체와 센서들의 기하급수저 발전으로 인해 각각의 영역에서 최고의 성능을 발휘하지만, 전부 다 각자의 언어로 이루어져 있기 때문에 통합적인 판단이 불가능함. 모두 따로 논다.
그러나 테슬라는 하나의 통합 OS가 차 전체를 총괄하고 있기 때문에 통합적인 판단이 가능하다. 그래서 이 상태에서 인공지능이 붙게 되면 차가 스스로 운전 해버리는 말도 안 되는 일이 일어남.
길이 좁을 땐 백미러를 접는 등 마치 생명체처럼 움직이는 거다. 이는 하나의 수학적 언어가 전체를 통합하고 있고. 인공지능이 그 언어와 대화하고 있기 때문이다.
팔란티어 인공지능
팔란티어에서는 수학적 언어 기반을 [Ontology]라고 부른다. 팔란티어는 기업의 모든 데이터를 온톨로지라는 언어로 재구성해서 하나의 통합 OS로 만들어주는 일을 한다. 그러니까 GPT와 같은 언어 인공지능이 특정 대성과 만나 시너지 효과를 내기 위해서는 대상이 우선적으로 수학적 언어 구성이어야 한다. 인간의 언어는 불완전하기 때문임.
팔란티어의 CEO는 기업을 하나의 수학적 언어로 만드는 일을 20여 년을 준비해 왔다. 테슬라는 먼저 통합 OS로 자율주행 시장에 큰 변화를 일으켰고, 팔란티어는 이제 곧 시작하려고 한다. 아래 글은 팔란티어가 무슨 일을 하고 준비해왔는지 알 수 있는 글인데 관심있으면 참고하자
팔란티어 돈 넣어도 괜찮을까? PLTR 데이터 분석 끝판왕
핫한 팔란티어 주식에 대해서 알아보자 팔란티어 (PLTR) - 주가: $39 (2021.01.28) - 2004년 캘리포니아에서 설립된 데이터 분석 전문 기업 (9/30 상장) - CIA 소유의 벤처캐피털 인큐텔(In-Q-Tel)의 투자로 시
monjaeda.com
댓글0