Plan Szkolenia

Szczegółowy plan szkolenia

    Wprowadzenie do NLP Zrozumienie ram NLP NLP Komercyjne zastosowania NLP Pobieranie danych z Internetu Praca z różnymi interfejsami API w celu pobierania danych tekstowych Praca i przechowywanie korpusów tekstowych Zapisywanie treści i odpowiednich metadanych Zalety korzystania z Pythona i kursu przyspieszonego NLTK Praktyczne zrozumienie korpusu i zbioru danych Dlaczego czy potrzebujemy korpusu? Analiza korpusu Rodzaje atrybutów danych Różne formaty plików dla korpusów Przygotowanie zbioru danych dla zastosowań NLP Zrozumienie struktury zdań Składniki NLP Rozumienie języka naturalnego Analiza morfologiczna - rdzeń, słowo, token, znaczniki mowy Analiza syntaktyczna Analiza semantyczna Obsługa niejednoznaczności Wstępne przetwarzanie danych tekstowych Korpus - surowy tekst Tokenizacja zdań Stemming dla surowego tekstu Lemmizacja surowego tekstu Zatrzymaj usuwanie słów Surowe zdania korpusowe Word tokenizacja Word lematyzacja Praca z macierzami Term-Dokument/Dokument-Term Tokenizacja tekstu na n-gramy i zdania Praktyczne i dostosowane do indywidualnych potrzeb przetwarzanie wstępne Analizowanie danych tekstowych Podstawowa cecha NLP Parsery i analizowanie Tagowanie i tagowanie POS Rozpoznawanie jednostek nazw N-gramy Zbiór słów Cechy statystyczne NLP Pojęcia algebry liniowej dla NLP Teoria probabilistyczna dla NLP TF-IDF Wektoryzacja Kodery i dekodery Normalizacja Modele probabilistyczne Zaawansowana inżynieria cech i NLP Podstawy word2vec Elementy modelu word2vec Logika modelu word2vec Rozszerzenie koncepcji word2vec Zastosowanie modelu word2vec Studium przypadku: Zastosowanie worka słów: automatyczne podsumowywanie tekstu przy użyciu uproszczonych i prawdziwych algorytmów Luhna Grupowanie dokumentów, klasyfikacja i modelowanie tematyczne Grupowanie dokumentów i eksploracja wzorców (grupowanie hierarchiczne, k-średnie, grupowanie itp.) Porównywanie i klasyfikacja dokumentów przy użyciu TFIDF, Jaccarda i cosinusowych miar odległości Klasyfikacja dokumentów przy użyciu naiwnego Bayesa i maksymalnej entropii Identyfikacja ważnych elementów tekstowych Redukcja wymiarowości: analiza głównych składowych, rozkład wartości osobliwych nieujemna faktoryzacja macierzy Modelowanie tematów i wyszukiwanie informacji przy użyciu ukrytej analizy semantycznej Ekstrakcja jednostek, analiza nastrojów i zaawansowane modelowanie tematów Pozytywne vs. negatywne: stopień sentymentu Teoria odpowiedzi na element Część znakowania mowy i jego zastosowanie: znajdowanie osób, miejsc i organizacji wymienionych w tekst Zaawansowane modelowanie tematów: Utajona alokacja Dirichleta Studia przypadków Wyszukiwanie nieustrukturyzowanych recenzji użytkowników Klasyfikacja nastrojów i wizualizacja danych z recenzji produktów Wyszukiwanie dzienników wyszukiwania wzorców użytkowania Klasyfikacja tekstu Modelowanie tematów

Wymagania

Znajomość i świadomość zasad NLP oraz docenienie zastosowania sztucznej inteligencji w biznesie

 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie