Zlecenie 7210236 - ZAPYTANIE OFERTOWE 01/12/2019: Oprogramowanie do analizy...
(zakończone) | Zamówienie 7210236|
---|---|
źródło | Internet |
data publikacji | 2019-12-05 |
przedmiot zlecenia | ZAPYTANIE OFERTOWE 01/12/2019: Oprogramowanie do analizy treści, wykorzystujące algorytmy sztucznej inteligencji w celu zautomatyz owania procesu wydawniczego i predykcji sukcesów rynkowych publikacji” Etap 1 Analiza porównawcza tekstów Przeprowadzenie badań nad modelami głębokich sieci neuronowych automatycznego rozpoznawania kluczowych metadanych o książkach w języku polskim do obowiązków wykonawcy należy przygotowanie zbioru danych uczących opartych na tekstach literackich w j. polskim, przeprowadzenie eksperymentów polegających na wykorzystaniu sieci typu transformer w celu identyfikacji kluczowych meta-informacji ,udostępnienie wyników w postac najlepszegoi modelu oraz dokumentacji projektowej Rozpoznawanie NER (Named Entity Recogniotion) - Opracowanie technologii ekstrakcji konceptów z tekstów literackich przygotować model do rozpoznawania słów z kategorii:: zawody, miejsca geograficzne, miejsca fikcyjne, brand, produkt, eventy, stany emocjonalne do obowiązków wykonawcy należy przygotowanie zbioru danych uczących opartych na tekstach literackich w j. polskim, minimalny rozmiar zbioru uczącego: 50 000 próbek oznaczeń dokładność rozpoznania wszystkich etykiet na poziomie 70% Etap 2 Opracowanie modelu języka i algorytmów ukierunkowanego generowania treści w oparciu o metody głębokiego uczenia przygotowanie i zebranie danych potrzebnych do uczenia modelu języka min. 5GB tekstu w języku polskim przeprowadzenie procesu uczenia modelu języka polskiego w trybie przewidywaniu następnego słowa lub testu cloze przygotowanie modelu i opracowanie usługi generującej 400-600 słów tekstu na podstawie kontekstu tekst powinien być bardzo zbliżony do tekstów redakcyjnych dostarczonych przez zamawiającego Cel zamówienia Celem zamówienia jest wybór Wykonawcy, który będzie świadczył usługę wsparcia prowadzonych przez Zamawiającego prac badawczo-rozwojowych polegające na przeprowadzeniu badań nad modelami głębokich sieci neuronowych automatycznego rozpoznawania kluczowych metadanych o książkach w języku polskim, rozpoznawanie NER (Named Entity Recogniotion) - opracowaniu technologii ekstrakcji konceptów z tekstów literackich oraz opracowaniu modelu języka i algorytmów ukierunkowanego generowania treści w oparciu o metody głębokiego uczenia. Literacka Sp. z o.o. ubiega się o dofinansowanie na prace badawczo - rozwojowe w ramach Konkursu 6/1.1.1/2019 - Szybka ścieżka NCBR pn. „Oprogramowanie do analizy treści, wykorzystujące algorytmy sztucznej inteligencji w celu zautomatyzowania procesu wydawniczego i predykcji sukcesów rynkowych publikacji” Przedmiot zamówienia Przedmiotem zamówienia jest: 1) Analiza porównawcza tekstów -Etap 1 Przeprowadzenie badań nad modelami głębokich sieci neuronowych automatycznego rozpoznawania kluczowych metadanych o książkach w języku polskim do obowiązków wykonawcy należy przygotowanie zbioru danych uczących opartych na tekstach literackich w j. polskim, przeprowadzenie eksperymentów polegających na wykorzystaniu sieci typu transformer w celu identyfikacji kluczowych meta-informacji ,udostępnienie wyników w postac najlepszegoi modelu oraz dokumentacji projektowej Rozpoznawanie NER (Named Entity Recogniotion) - Opracowanie technologii ekstrakcji konceptów z tekstów literackich przygotować model do rozpoznawania słów z kategorii:: zawody, miejsca geograficzne, miejsca fikcyjne, brand, produkt, eventy, stany emocjonalne do obowiązków wykonawcy należy przygotowanie zbioru danych uczących opartych na tekstach literackich w j. polskim, minimalny rozmiar zbioru uczącego: 50 000 próbek oznaczeń dokładność rozpoznania wszystkich etykiet na poziomie 70% 2) Etap 2- Opracowanie modelu języka i algorytmów ukierunkowanego generowania treści w oparciu o metody głębokiego uczenia przygotowanie i zebranie danych potrzebnych do uczenia modelu języka min. 5GB tekstu w języku polskim przeprowadzenie procesu uczenia modelu języka polskiego w trybie przewidywaniu następnego słowa lub testu cloze przygotowanie modelu i opracowanie usługi generującej 400-600 słów tekstu na podstawie kontekstu tekst powinien być bardzo zbliżony do tekstów redakcyjnych dostarczonych przez zamawiającego |
branża | Laboratoria |
podbranża | usługi laboratoryjne |
kody CPV | 73000000 |
forma | zapytanie ofertowe |
typ zlecenia | usługi, wykonanie |
kraj realizacji | Polska |
województwo realizacji | Warmińsko-Mazurskie |
kraj organizatora | Polska |
województwo organizatora | Warmińsko-Mazurskie |