المحاضرة شرحت Natural Language Processing (NLP) كفرع من الذكاء الاصطناعي بيخلي الكمبيوتر يفهم ويتعامل مع اللغة البشرية، وبيحتاج معرفة بمستويات مختلفة زي phonetics, syntax, semantics. اتكلمت عن تحديات اللغة زي الغموض (ambiguity) وحلول زي disambiguation. شرحت أدوات زي NLTK في Python لتحليل النصوص باستخدام tokenization, POS tagging, وNER. وضحت كمان التطبيقات العملية زي machine translation (Google Translate)، sentiment analysis، وchatbots زي Alexa وSiri. وأخيرًا، استعرضت التطور التاريخي للـ NLP من قواعد يدوية لحد neural networks الحديثة.
موقع Python الرسمي
https://www.python.org
NLTK Documentation
https://www.nltk.org
Google Colab (لتشغيل الأكواد أونلاين)
https://colab.research.google.com
WordNet (قاموس إنجليزي مترابط بيستخدمه NLTK)
https://wordnet.princeton.edu
ELIZA Online Demo (لو عايز تجرب البرنامج القديم ELIZA)
http://www.chayden.net/eliza/Eliza.html
Module 2 | RE, Tokenization & Edit Distance
Introduction (How to study DS483)
Module 2 | RE, Tokenization & Edit Distance
Module 3 | N-gram Language Models
Module 4.1 | Text Classification: Naive Bayes and Logistic Regression Part I
Module 4.2 | Text Classification: Naive Bayes and Logistic Regression Part II
Module 5 | Vector Semantics and Embeddings
Module 6 | Neural Networks
Module 7 | RNNs and LSTMs
Module 8 | Transformers
Module 9 | Large LM & Masked LM
Module 10 | Sequence Labeling for Parts of Speech and Named Entities
Module 11 | Context-Free Grammars & Dependency Parsing
Module 12 | Machine Translation
Module 13 | Chatbots & Dialogue Systems
Midterm Revision
Final Revision