SAN's history/book
[도서 리뷰] 파이썬 라이브러리를 활용한 텍스트 분석
saniii
2022. 11. 30. 03:20
NLP를 개인 프로젝트에 적용할 수 있도록 안내하는 책
텍스트를 기반으로 한 AI 모델을 만들고자할 때 이 책으로 도움을 받을 수 있다. 일기나, 말투를 기반으로 사람의 감정을 분석하는 서비스나, 문법 자동 완성 서비스 등등 사람의 말을 기반으로 AI 모델을 학습하여 제공할 수 있는 서비스는 NLP를 기반으로 한다.
개인적으로 졸업프로젝트로 NLP를 공부해야하는 상황이었는데 우선 NLP 모델을 만들어 학습하기 전에 원하는 모델을 학습하기 위한 데이터를 준비하는 과정부터 난감하였다. 데이터를 어디서 끌어와야할지, 크롤링을 한다면 어떻게 시작해야할지 그런데 이 책은 데이터를 준비하는 과정(크롤링)부터 모은 데이터들로 할 수 있는 다양한 NLP 모델들을 소개한다. 또한 모델의 성능을 높일 수 있는 방법을 차례대로 알려준다.
이 책을 읽으면서 가장 좋았던 점은 NLP만 덩그러니 알려주는 것이 아닌 데이터를 수집하는 과정부터 소개하기 때문에 개인 프로젝트에 쉽게 응용할 수 있겠다는 점과 성능을 발전시킬 수 있는 방법이 제시되어 있다는 점이었다.
물론 유의해야할 점도 있는데 머신러닝에 대한 기초지식이 없다면 이 책은 읽기 어려울 수 있다. 머신러닝에 대한 기초지식이 있고 특히 NLP 모델을 만들고자할 때 이 책을 읽으면 좋을 것 같다. 또한 한국어 기반의 모델을 만들고 싶다면 조금의 개인적인 노력을 더해야 한다는 점도 염두에 두는 것이 좋다. (이 책의 예제는 영어 문장이기 때문에)
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."