Benutzer:PlusMinuscule/ToDoListe
From Wikipedia, the free encyclopedia
To Do liste
- siehe auch englische seite
- siehe mein Kommentar für englische Semantic Parsing Seite bezogen auf Types of semantic parsing: Bitte um kompletten rewrite (inhaltich missverständlich bis fehlerhaft, veraltete Quellen): https://en.wikipedia.org/wiki/Talk:Semantic_parsing#Asking_for_a_complete_rewrite_of_section_%22Types_of_semantic_parsing%22
- Artikel Tokenisierung: siehe mein alter Kommentar und nun noch ergänzt um neue Bedeutung von "Tokens" und "Tokenisierung" bei LLMs ("subwords")
- Tokenisierung (Computerlinguistik) vs Tokenizer (Weiterleitung zu Lexer: Compilerbau), keine oder kaum gegenseitige Referenzierung/Hinweis? siehe auch mein alter Kommentar beim Lexer
- Artikel Named-entity recognition: siehe mein alter Kommentar
- Artikel Sentiment Detection: siehe mein alter Kommentar - evtl heutzutage auch eher Richtung ML und Neuronale Netze.
- (en) Abstract Meaning Representation: Bild wäre toll und vielleicht mehr Beispiele? evtl weiter ausführen Datensätze, Parsingansätze und aktuelle Parsingqualität? Eventuell Anwendungen? Eventuell sprachabhängigkeit (AMR für nicht-englisch: beispiel? was ist anders?)? Was kann AMR nicht so gut modellieren, wo liegen die Stärken?
- (en/de) Tree-Adjoining Grammar im deutschen relativ kurz: Bilder ergänzen, mehr zur Parsing-Komplexität/Äquivalenz mit deren Formalismen, (vergleich auch mit englischer Version), auch die englische ohne bilder... : erste Ergänzungen selbst vorgenommen, aber noch nicht zufrieden (de,en).
- Parsing von natürlichen Sprachen: syntaktisch (insb. Dependenz) und semantisch: wo finden sich dazu Infos in deutscher und englischer Wikipedia? (auch: neural vs non-neural parsers, Projektivität und asymptotische Komplexität, Universal Dependencies, evaluation metric LAS/UAS und exact match, evtl Tools wie spacy oder nltk?): fürs Deutsche ersten Entwurf "Dependenzparsing" geschrieben (im Englischen kein direktes äquivalent). zum Fehlen einer deutschen "Syntaktisches Parsing (Computerlinguistik)" ähnlich dem fürs Englische wurde hier bei kfGs hingewiesen von mir.
- dep deutsch fehlt noch: baumbanken zu Baumbank (Linguistik) verschieben mehr? mehr in History, bei transition- und grpah-based mehr ausführen (oracle, ...), parsingkomplexität blockgrad erwähnen?
- LLMs im Deutschen: zwei Anmerkungen zum Stand : Multimodalität, bitte um weitere Abschnitte ergänzen.
- Es fehlen Artikel im Deutschen zu Cross-serial dependencies (en: verbindung zur copy-sprache, zu count-4, ...), zu Seq2seq (en), zu BERT (en), zu semantic parsing (en), Chu-Liu-Edmonds-Algorithmus (en)
- Bilder: mehr zu cross-serial dependencies, gibt nur wenige bisher?
x