본문 바로가기

딥러닝

GPT3 | Language Models are Few-Shot Learners

글쓰기, 숫자 더하기나, SQL query, coding, 문장 완성 등 downstream task를 zero-shot 및 few-shot으로 수행할 수 있게 됨

GPT3에서 집중한 것

In-context learning

  • LM은 원래 단어 sequence를 기반으로 다음 단어의 확률을 예측하는 것이었는데, 여기에 더해서 데이터 속의 패턴을 학습하기 시작함
  • 여기에 example이나 description을 주면, 모델이 example의 패턴을 인식해서 과거 유사한 패턴을 찾고 task를 수행함