[NLP] Introduction to NLP
๐ง๐ป๐ป ์ฃผ์ ์ ๋ฆฌ
NLP
The history of NLP
The field of NLP
Ambiguous
Sparsity
Variation
๋ฐฐ๊ฒฝ ์ง์
NLP๋ ๋ฌด์์ผ๊น์?
๊ตฌ๊ธ์ ๊ฒ์ํด๋ณด๋ฉด ์์ ๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์ต๋๋ค.
์์ด๋ก ๋ณด์๋ฉด,
NLP(Natural Language Processing) is a field of computer science and artificial intelligence concerned with enabling computers to understand, interpret, and generate human language.
์ด๋ ์ต๋๋ค.
NLP์ ๋ชฉํ?
๋ชฉํํ๋ ๋ฐ๋, ๋ถ์๊ฐ๋ฅํ๊ณ , ์ดํด๊ฐ๋ฅํ๋ฉฐ, human language๋ฅผ ๊ตฌํํ ์ ์๋ ์์คํ ์ ๋ง๋๋ ๊ฒ์ ๋๋ค.
NLP์ ์ญ์ฌ?
์์ ๊ฐ์ ์ญ์ฌ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค.
์ฌ๊ธฐ์ Statistical models์ด ์์ต๋๋ค.
์ด๋ ํ๋ฅ ์ ๊ธฐ๋ฐํ ๋ชจ๋ธ์ ๋๋ค.
๊ทธ๋ฆฌ๊ณ , ์ด๊ณณ์์ ์ฐ๋ฆฌ๋ ์ต๊ทผ์ ์ญ์ฌ๋ฅผ ์ดํด๋ณผ ์ ์์ต๋๋ค.
ํ์ฌ OpenAI์์ ๊ฐ๋ฐํ ChatGPT๋ผ๋ chat bot์ด ์ง๊ธ์์์ผ ๊ฐ๊ด๋ฐ๋ ์ด์ ๋ ๋ฌด์์ผ๊น์?
์ฌ์ค CNN, RNN์ ์ด๋ก ๋ค์ ์์ ๋ถํฐ ์กด์ฌํ์ต๋๋ค.
๊ทธ๋ฌ๋ ์ต๊ทผ 2013๋ ๋ถํฐ GPU๋ฅผ ์ด์ฉํ ๋ณ๋ ฌ ์ฐ์ฐ์ด ๊ฐ๋ฅํด์ ธ, ์ด์ ์ ์ด๋ก ์ CPU๋ก๋ ์ฐ์ฐํ ์ ์์๋ ๊ฒ๋ค์ด ๊ฐ๋ฅํด์ก์ต๋๋ค.
๊ทธ๋์ ์ง๊ธ์์์ผ generative mode์ธ Seq2Seq model์ด๋, Attention, Pretrained Models, GPT-4์ ๊ฐ์ ๊ฒ๋ค์ด ๊ฐ๋ ฅํ ํ์ ๊ฐ๊ฒ ๋์์ต๋๋ค.
NLP์ ์ฌ์ฉ?
๋ถ์ผ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- Sentiment / Emotion analysis
- Machine translation
- Vision and language
- Chatbot, Conversational AI
- Question answering
- Text Summarization
- Code generation
- Story generation
์ ๋ถ์ผ๋ค์, NLP ๋ถ์ผ์์ ์์ฃผ ์ฌ์ฉ๋๋ฉฐ ์ฐ๊ตฌ ์ค์ ๋๋ค.
์ ๋ถ์ผ๋ Classification NLP์ Generation NLP๋ก ๋๋ ์ ์์ต๋๋ค.
๋ฌธ์ฅ์ ์์ฑํ๋ Seq2Seq ๊ฐ์ ๊ฒ์ด Generation model์ด๊ณ , Classification model์ ์ด๋ค data์์ ์ํ๋ ๊ฐ์ ๊ฐ์ ธ์ค๋ ๊ฒ์ ๋๋ค.
NLP๋ฅผ ์ด์ฉํ APP?
์ ๋ถ์ผ์ ๋ํ ์ฌ๋ฌ ๊ฐ์ง Application์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- DeepMoji
- Google Neural Machine Translation
- SQuAD
- Visual Question Answering
- Microsoft DialoGPT
- Google Meena
- Google PEGASUS
- Facebook AI Research TransCoder
- Github Copilot
- OpenAI GPT-4
- OpenAI Jukebox
- Protein folding problem
- OpenAI DALL-E2
- Google IMAGEN
NLP์ ์ด๋ ค์?
NLP์๋ ์ด๋ ํ ์ด๋ ค์์ด ์กด์ฌํ ๊น์?
ํ๋์ฉ ์ดํด๋ด ์๋ค.
Ambiguous
Words have many meanings.
๋จ์ด์๋ ๋ง์ ๋ป์ด ์์ต๋๋ค.
์ฐ๋ฆฌ๊ฐ ๋จน๋ ๋ฐค๋ ์กด์ฌํ๊ณ ,
๋ฐคํ๋์ ๋ปํ ๋ ์ฐ๋ ๋ฐค๋ ์กด์ฌํฉ๋๋ค.
์ด๋ฌํ ์๋ฏธ์ ๋ชจํธ์ฑ ์์์ NLP๋ ์ด๋ป๊ฒ ๋ฐ์ ํ ์ ์์๊น์?
Sparsity
์ฐ๋ฆฌ๋ ๋ฌธ์ฅ์ ๊ตฌ์ฑํ ๋,
๊ฐ์ฅ ๋ง์ด ์ฐ๋ ๋จ์ด๊ฐ ์์ต๋๋ค.
์ด๋ฅผ ํ ๋ฉด, "์,๋,์ด,๊ฐ", ๋ฑ๋ฑ..
์์ด์์๋ "is", "the", "a" , etc..
๊ทธ๋ ๋ค๋ฉด ํต๊ณํ์ ์ผ๋ก ๋ค์ ๋จ์ด๋ฅผ ์์ธกํจ์ ์์ด ์ฐ๋ฆฌ๋ ์์ ๊ฐ์ ๋จ์ด๋ค์ ๊ณ ๋ฅผ ์ ๋ฐ์ ์์ต๋๋ค.
์ด๋ฌํ Sparsity๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, NLP์์๋ ์ด๋ค ๋ฐฉ์์ ์ฌ์ฉํ์๊น์?
Variation
์ฐ๋ฆฌ๋ ์๊ฐ์ ๊ฑฐ์ณ์ ๋ง์ ํฉ๋๋ค.
๊ทธ๋ฌ๋, ์ด๋ค ๊ฒ์ด ๋ ์ข์ ๋ฌธ์ฅ์ผ๊น๋ฅผ ํญ์ ์๊ฐํ์ง๋ ์์ฃ .
๊ฒฉ์์ ์ฐจ๋ ค์ผ ํ๋ ์๋ฆฌ์์ ์ฐ๋ฆฌ๋ ์ด๋ค ๊ฒ์ด ๋ ์ ์ด ๋ฌธ์ฅ์ผ์ง๋ฅผ ์๊ฐํฉ๋๋ค.
ํน์ ๋ ผ๋ฌธ์ ์ธ ๋๋ ๊ทธ๋ ์ฃ .
๊ทธ๋ ๋ค๋ฉด, NLP์์๋ ์ด๋ป๊ฒ ์ด๋ฅผ ํด๊ฒฐํ ๊น์?
๊ณ์ํด์ ์์๋ด ์๋ค.
'Artificial Intelligence > Natural Language Processing' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[NLP] Word Embedding - Word2Vec (0) | 2023.03.27 |
---|---|
[NLP] Word Embedding - Skip Gram (0) | 2023.03.27 |
[NLP] Word Embedding - CBOW (1) | 2023.03.27 |
[NLP] Introduction to Word Embedding (0) | 2023.03.26 |
[NLP] Overview NLP (0) | 2023.03.21 |