책 읽고 정리하기/2024

쉽고 빠르게 익히는 실전 LLM(ChatGPT 활용부터 LLM 파인튜닝, 임베딩, 고급 프롬프트 엔지니어링까지)

TwinParadox 2024. 2. 25. 03:48
728x90

쉽고 빠르게 익히는 실전 LLM

서론


저자의 경험을 바탕으로 이해한 LLM에 대한 내용들을 책에 모아놓은 느낌을 받았다.

ChatGPT로 LLM이라는 것에 처음으로 관심을 가지게 된 사람부터 본격적으로 솔루션을 만들어보려는 기획자, 이를 설계하고 개발하는 개발자까지 다양한 사람들을 상대하면서 본인이 경험했던 내용들에 대해 이해하기 쉽게 녹여놓은 책으로 기억에 남는다.

 

 

책의 구성


Part 1. LLM 소개

LLM에 대한 기초적인 내용을 다룬다.

텍스트 임베딩, 어텐션, 트랜스포머 등 NLP 지식이 어느정도 있는 사람들은 빠르게 훑고 넘어가도 되는 내용들도 포함되어  자연어 처리가 익숙한 사람들은 빠르게 훑고 넘어가도 되는 내용들을 다룬다. 의미 기반 검색(Semantic Search)를 직접 구성해보기도 하고, 저자가 프롬프트 엔지니어링을 얼마나 중요하게 생각하는지도 알 수 있다.

이 파트에서 흥미로웠던 부분은 Chapter 2 말미에 간략하게 적어놓은 클로즈드 소스 기반의 솔루션 구성 비용이다. 추상적으로만 생각했던 구축 비용에 대해서 어떻게 산정하는지 예시를 보여줘서 인상적이었다.

 

Part 2. LLM 활용법

이 파트부터는 실전 사례와 예제 코드를 바탕으로 앞선 파트보다 깊은 내용을 다루고 있다. 

파운데이션 모델의 파인튜닝을 어떻게 해야 더 좋은 성능을 얻어낼 수 있는지 비용 관점에서 어떤 이득을 취할 수 있는지, 데이터는 어떻게 준비해야 하는지에 대한 내용을 다루고 있다. 이 파트에서도 프롬프트 엔지니어링은 Chapter 5로 따로 구성하여, 프롬프트 자체에 대한 공격 방식 몇 가지를 소개하면서 프롬프트의 중요성을 다시 한번 상기시킨다.

이 파트까지 읽었을 때, 저자가 얼마나 프롬프트를 중요하게 생각하는지 알 수 있었다. 활용 방법에 대해서 다시 한 번 생각하게 되었다.

 

Part 3. 고급 LLM 사용법

여기서부터는 모델을 직접 학습하고 개발하는 심화 내용에 대해 이야기한다.

LLM을 다른 모델과 결합하기도 하고, 더 좋은 성능을 위해 어떻게 파인 튜닝을 해야 하며 학습 기법들에는 어떤 것들이 있는지도 사례를 바탕으로 어려운 내용들을 다루고 있다. 이미 모델 연구를 하고 있거나, 머신러닝 엔지니어로 현업에 종사하고 있는 사람들에게는 익숙한 내용일지 모르겠지만, 그게 주 업무가 아닌 사람들에게는 이해하기 어려운 내용들이 많다. 직간접적으로 경험했던 학습 기법이나, 학습 내용을 바탕으로 겨우겨우 읽었지만, 완벽하게 이해하지는 못한 파트다.

여기서도 Chapter 9는 아무래도 익숙한 내용들을 다루고 있고, Knowledge Distillation을 통한 학습은 서비스에서 어떤 이득을 취할 수 있는지에 대한 내용이 흥미롭게 다가왔다.

 

 

이 책을 읽으면서 좋았던 부분


저자가 생각하는 LLM 의 핵심 내용들을 사례와 예제 코드로 만날 수 있다.

이 책은 전문서가 아닌 실용서다. 진짜 깊은 내용까지 다루고 있지 않음에도, 전문 지식을 갖추고 있지 않은 사람들은 책의 후반부로 갈수록 다루고 있는 내용을 한 번에 이해하기 어려울 것 같다는 생각이 들 수 있다. 하지만, 다양한 사례를 바탕으로 이해하기 쉽게 풀어내려는 노력이 보였고, 예제 코드와 예제 이미지로 이해를 돕고 있어서 이해하는데 큰 도움이 되었다. AI에 대한 경험 자체가 없어서, 용어가 익숙하지 않은 사람들은 책의 부록에 용어 설명도 포함되어 있으니 이것과 웹 검색을 적극 활용하면 도움이 될 것 같다.

 

 

프롬프트 엔지니어링의 중요성을 알게 해줬다.

이 책에서 LLM이라는 단어를 제외하고 가장 중요하게 다루고 있는 내용 중 하나가 프롬프트 엔지니어링이라고 생각한다. "원하는 결과를 얻으려면 질문만 잘하면 된다."라는 식으로 프롬프트 엔지니어링에 대해 추상적으로만 이해하고 있는 나를 포함한 많은 사람들에게 이것이 왜 중요한지 알려주려고 하는 것 같았다. 단순히 질문을 잘해야 한다는 내용에서 벗어나서, 어떻게 작용하는지를 설명하고 프로세스에서 중요한 요점들을 추려서 설명해주고 있어서 잘 와닿았던 것 같다. 사람의 입장에선 질문이 중요한 시대가 된 셈인데, 프롬프트 엔지니어링을 해체 분석하면서 이를 어떻게 활용해야 좋을지 생각해 보는 계기도 되었다.

 

 

요약


  • LLM을 처음 만나거나, 만난 지 오래되었거나, 자주 만나는 사람 모두에게 유용한 가이드북
  • AI 기반 지식이 아예 없는 사람이라면 이해하기 어려운 책이므로, 선행 학습을 권장

 

 

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다.

728x90
728x90