우리의 삶에 점차 침투해 오고 있는 Chat GPT를 비롯한 생성 AI. 매우 편리하지만 출력되는 정보는 반드시 올바른 것은 아닙니다. 생성 AI를 능숙하게 이용해, 사귀어 가려면···? 「그 특성이나 주의점을 알 필요가 있다」라고 말해지는 미야모리 선생님에게 이야기를 들었습니다.

 

생성 AI란?

 생성 AI란 단어나 이미지 등을 '생성할 수 있는' AI를 말합니다. 기존의 AI는 단어나 이미지 등을 '이해한다'는 점을 중시한 이해형의 AI였습니다. 생성 AI는 이전부터도 존재하고 있었지만, 성능이 높지 않았기 때문에 Chat GPT의 등장까지 주목할 기회는 많지 않았습니다.

 Chat GPT는 유창한 말로 대화할 수 있는 생성 AI의 대표적인 예로, 인간의 질문에 답하거나 아이디어를 제안하고, 서면 작성을 도와주거나, 다양한 의뢰에 응해 줍니다. . 이전에도 일본어 등 자연 언어로 질문 응답이나 대화를 하는 시스템은 존재했지만, ChatGPT는 출력되는 문장의 품질이 매우 높은 점이 특징입니다. 문장뿐만 아니라, 글머리 기호나 표 형식으로 정리해 주는 점도 지금까지의 종래 시스템과는 크게 다릅니다.

 한편, 이미지를 만들어내는 생성 AI도 이용이 퍼지고 있습니다. 예를 들어, X선 영상으로부터 질병 진단을 하는 AI를 구축하기 위해서는 양질의 X선 영상이 대량으로 필요하지만, 희귀한 질병의 경우에는 이러한 X선 영상을 수집하는 것 자체가 어렵다. . 그래서 이미지 생성 AI로 작성한 의사 X선 이미지도 추가하여 훈련함으로써 질병의 진단 성능이 향상되는 것으로 보고되었습니다. 유사한 사용법은 위성 이미지에 의한 불법 조업선 감지에서도 수행됩니다. 생성 AI의 생활이나 사회에의 영향은 크고, 현재, 전세계에서 법정비 등이 급피치로 진행되고 있습니다.

생성 AI의 문제점이란?

 편리하게 보이는 생성 AI에도 문제점이 있습니다. 하나는 《출력 내용의 정확성을 담보할 수 없다》. 예를 들어, Chat GPT에게 추천하는 가게를 들으면, 가상의 가게 이름과 주소가 돌아왔다는 경험은 없을까요? 답변이 너무 자연스럽기 때문에주의가 필요합니다. 의료나 법률에 관련되는 교환의 경우는 특히 요주의입니다. 또 《인간의 상식》이 통하지 않는 점도 문제입니다. 예를 들어,
채팅 GPT는 법률을 무시했다는 것을 명확하게 제안합니다. 선술집의 매출 향상안을 물어보면 미성년에게 술을 권하는 등의 제안을 해오기도 합니다.

 이러한 문제의 한 원인은 생성 AI가 문장 등을 학습하는 구조가 인간과는 다른 점에 있습니다. 예를 들어, Chat GPT와 같은 단어를 다루는 생성 AI(대규모 언어 모델; LLM이라고도 함)는 그물에서 모인 방대한 문장을 바탕으로 한 단어 다음에 출현하기 쉬운 단어는 무엇인가를 학습 합니다. 즉, Chat GPT등의 생성 AI는, 순수하게 말의 규칙성에 근거한 지식 밖에 획득할 수 없는 것입니다(주).

 한편, 인간은 몸, 오감을 통해 밖의 세계로부터 많은 자극을 얻음으로써 단어의 지식을 획득합니다. 신체가 없는 Chat GPT등에는 이런 학습은 할 수 없기 때문에, 현재는 인간의 감각이나 지식과는 큰 격차가 있습니다.
참고: Chat GPT의 경우 2023년 9월에 GPT-4V라는 새로운 버전이 발표되었으며, 단어뿐만 아니라 이미지를 처리할 수 있게 되었습니다.

고등학생에게 메시지

 Chat GPT를 비롯한 생성 AI의 구조를 제대로 이해하려면 프로그래밍을 배우는 것만으로는 충분하지 않으며 수학 지식도 필수적입니다. 수학이 특별한 자랑일 필요는 없지만, 서투른 의식을 가지지 않도록 공부해 둡시다. 또, AI 기술의 진화는 매우 빠르고, 최신의 성과의 대부분은 영어로 발표되기 때문에, 영어력도 항상 닦아 두는 것을 추천합니다.

 진로 선택에 있어서는, 고민하는 일도 있을지도 모릅니다만, 사회의 동향도 잘 주시하면서, 자신이 두근두근하는, 즐거운 것 같다고 생각되는 분야를 찾아내면 좋겠습니다. 생성 AI는 새로운 기술이며 사회의 모든 영역에서 변화를 가져옵니다. 기술 개발에 흥미가 있는 분은, 꼭 그 구조를 배우고, 자신의 능력을 마음껏 발휘해 주었으면 합니다. 또한 기술개발에 관심이 없는 분들도 AI 자체의 진화는 우리의 삶과 사회에 큰 영향을 미칠 것으로 예상되므로 기본적인 이해를 깊게 하는 것이 중요합니다. 미래를 예측하면서, 하고 싶은 일을 끊을 수 있는 환경을 찾아, 거기에 적극적으로 뛰어들어 가 주세요.

어떤 수업?

 전문과목의 수업에서는 자연언어 처리와 기계 학습에 대해 최신 기술을 포함하여 정중하게 설명하고 있습니다. 주로는 반전 수업 형식으로, 학생에게는 온 디맨드 강의 동영상으로 예습해 주셔, 수업에서는 그룹 워크를 실시하고 있습니다. 학생 스스로 학습 내용의 확인 문제를 만들거나, 샘플 프로그램의 구멍 메우기를 실시하거나, 학생이《주체적·대화적으로 참가하는 것으로 깊은 배움으로 연결된다》하도록 궁리하고 있습니다.

 연구실의 세미나는 주별 담당자가 자신의 연구 진행 상황을 보고하고 그 내용에 대해 모두 논의하는 형식입니다. 몇 시간의 논의를 실시하기 때문에, 자신만으로는 얻을 수 없었던 깨달음이나 새로운 정보등도 얻을 수 있어, 매주, 밀도가 짙은, 충실한 시간이 되고 있다고 생각합니다.

 연구실에는 자연언어 처리나 컴퓨터 비전, 기계 학습, 정보 검색의 융합적 연구를 하고 있는 학생이 많아, 학부, 대학원에 한정되지 않고, 졸업생의 대부분은, 여기에서의 연구를 살려 취직 있습니다.

무슨 연구?

 현재의 연구 테마 중 하나는 단어와 이미지를 다루는 인공 지능이 숫자와 같은 추상적 개념을 어떻게 이해하는지, 어떻게 이해해야 하는지에 대한 것입니다.

 현재 대규모 언어 모델(LLM)과 같은 AI는 숫자를 이해하고 계산하기가 어렵습니다. 예를 들어, 4자리 x 4자리 계산은 거의 정답할 수 없습니다. 계산기와 같은 계산 앱과 연동시키면 정답할 수 있지만, 단체로는 어렵다.

 연구실에서는 AI가 인간처럼 10이라는 숫자를 이해할 수 있다면 1000이라는 숫자도 정확하게 이해하고 상황에 따라 활용할 수 있는지 조사하고 있습니다. 예를 들면, 다양한 색, 형상, 재질의 물체가 원형으로 늘어서 있는 화상(위 그림)을 보여, “황색의 금속의 원주로부터 세어 반시계 방향으로 3번째의 물체는?”라고 질문해, 해당 하는 물체를 AI에 대답시킵니다. AI는 세번째라면 정답합니다. 그러나 10번째, 100번째와 숫자가 커지면 제대로 대답할 수 없습니다. 현재의 AI의 수의 이해도는 표면적이며, 자릿수의 큰 수에서도 정확하게 활용할 수 있는 깊은 이해에는 이르지 않습니다. 이 이해를 향상시키는 방법을 밝히는 것이 하나의 목표입니다.

교토산업대학 정보이공학부 교수

미야모리 항 선생님

1997년 와세다대학 대학원 이공학연구과 박사과정 수료. 박사 (공학). 전문은 멀티미디어 데이터 공학, 기계 학습, 정보 검색. 원래 전기계에 흥미가 있었지만, 대학에서는 방송이나 통신 등을 다루는 전자통신학과를 전공. 4년차에서는 영상을 취급하는 연구실에 들어가 현재 지상파 디지털 방송 등에서 사용되고 있는 MPEG 규격과 관련된 연구에 종사했다. 학위 취득 후에는 NICT, 현·국립 연구개발법인 정보통신연구기구에서 영상 장면 검색, TV 프로그램과 인터넷의 융합적 이용, 정보의 신뢰성 평가 지원 등을 연구. 2008년 교토산업대학 컴퓨터이공학부 준교수, 2013년 동 교수, 현재에 이른다. 오사카 부립 기타노 고등학교 출신.

 

교토산업대학

문리 10학부 18학과가 모이는 일거점 종합대학

교토산업대학은 문계·이계 합쳐 10학부 18학과, 약 15,000명이 하나의 캠퍼스에서 배우는 일거점 종합대학입니다.이 장점을 살려, 실사회에서 사는 고도의 전문지식과 스킬을 기르는 것과 동시에, 학부를 넘은 지의 교류에 의해 종합적이고 유연한 배움을 전개하고 있습니다.각 분야의 제일[…]

대학 저널 온라인 편집부

대학 저널 온라인 편집부입니다.
대학이나 교육에 대한 지견・관심이 높은 편집 스탭에 의해 기사 집필하고 있습니다.