LINUX.ORG.RU

История изменений

Исправление shkolnick-kun, (текущая версия) :

В общем, word2vec 10 эпох:

model.wv.most_similar(positive='хвостострел_NOUN', topn=5)
[('модёр_NOUN', 0.6396694183349609),
 ('мочератор_NOUN', 0.6092097759246826),
 ('модеры_NOUN', 0.6014557480812073),
 ('жобэ_NOUN', 0.6006250381469727),
 ('банхаммер_NOUN', 0.5871785879135132)]
model.wv.most_similar(positive='кащенко_NOUN', topn=5)
[('кащенка_NOUN', 0.6909999251365662),
 ('кащенок_NOUN', 0.626151442527771),
 ('кащенко_ADV', 0.6231484413146973),
 ('ckotinko_PUNCT', 0.6163461804389954),
 ('сорримак_NOUN', 0.6158071160316467)]
model.wv.most_similar(positive='шрифт_NOUN', topn=5)
[('sans_CONJ', 0.7265832424163818),
 ('terminus_ADV', 0.7256990671157837),
 ('liberation_PUNCT', 0.7195568084716797),
 ('шревт_NOUN', 0.7151879072189331),
 ('arial_PUNCT', 0.7134194374084473)]
model.wv.most_similar(positive='говно_NOUN', topn=5)
[('дерьмо_NOUN', 0.8184361457824707),
 ('гавный_ADV', 0.7093496918678284),
 ('говнище_NOUN', 0.6976292133331299),
 ('говнецо_NOUN', 0.6850547194480896),
 ('гуано_NOUN', 0.6759455800056458)]
model.wv.most_similar(positive='зонд_NOUN', topn=5)
[('гуглозонд_NOUN', 0.6018263697624207),
 ('зонт_NOUN', 0.5945577621459961),
 ('телеметрия_NOUN', 0.567317008972168),
 ('анальный_ADJ', 0.5619350671768188),
 ('огораживание_NOUN', 0.5601028203964233)]
model.wv.most_similar(positive='раст_NOUN', topn=5)
[('раста_NOUN', 0.7719116806983948),
 ('rust_NOUN', 0.7233066558837891),
 ('rust_CONJ', 0.7073013782501221),
 ('rust_PUNCT', 0.701453447341919),
 ('руст_NOUN', 0.6895651817321777)]
model.wv.most_similar(positive='си_NOUN', topn=5)
[('c_NOUN', 0.7338270545005798),
 ('сишный_ADJ', 0.7080429792404175),
 ('сишко_NOUN', 0.7051551938056946),
 ('сишечка_NOUN', 0.7004752159118652),
 ('паскаль_NOUN', 0.6833376884460449)]
model.wv.most_similar(positive='хаскел_NOUN', topn=5)
[('хаскелла_NOUN', 0.6159344911575317),
 ('окамл_NOUN', 0.580714225769043),
 ('кложур_NOUN', 0.5619770884513855),
 ('хаскель_NOUN', 0.5588544607162476),
 ('окамля_NOUN', 0.5533505082130432)]
model.wv.most_similar(positive='жаба_NOUN', topn=5)
[('джава_NOUN', 0.71211838722229),
 ('жава_NOUN', 0.6997002363204956),
 ('ява_NOUN', 0.6793997287750244),
 ('жабка_NOUN', 0.6773425936698914),
 ('жавый_ADJ', 0.6263688802719116)]
model.wv.most_similar(positive='системд_NOUN', topn=5)
[('systemd_NOUN', 0.747096061706543),
 ('systemd_ADV', 0.7364323139190674),
 ('инит_NOUN', 0.7345833778381348),
 ('сустемд_NOUN', 0.7294409275054932),
 ('апстарт_NOUN', 0.7225962281227112)]

Явной связи делириума с лгбт пока не обнаружено. Я спать.

Ах да:

model.wv.most_similar(positive='потуга_NOUN', topn=5)
[('балабольство_NOUN', 0.6964146494865417),
 ('обсёр_NOUN', 0.6956055164337158),
 ('балаболка_NOUN', 0.6849945187568665),
 ('кукаретинг_NOUN', 0.6816418170928955),
 ('балабол_NOUN', 0.6807647943496704)]

Слово-детектор в общем.

Исправление shkolnick-kun, :

В общем, word2vec 10 эпох:

model.wv.most_similar(positive='хвостострел_NOUN', topn=5)
[('модёр_NOUN', 0.6396694183349609),
 ('мочератор_NOUN', 0.6092097759246826),
 ('модеры_NOUN', 0.6014557480812073),
 ('жобэ_NOUN', 0.6006250381469727),
 ('банхаммер_NOUN', 0.5871785879135132)]
model.wv.most_similar(positive='кащенко_NOUN', topn=5)
[('кащенка_NOUN', 0.6909999251365662),
 ('кащенок_NOUN', 0.626151442527771),
 ('кащенко_ADV', 0.6231484413146973),
 ('ckotinko_PUNCT', 0.6163461804389954),
 ('сорримак_NOUN', 0.6158071160316467)]
model.wv.most_similar(positive='шрифт_NOUN', topn=5)
[('sans_CONJ', 0.7265832424163818),
 ('terminus_ADV', 0.7256990671157837),
 ('liberation_PUNCT', 0.7195568084716797),
 ('шревт_NOUN', 0.7151879072189331),
 ('arial_PUNCT', 0.7134194374084473)]
model.wv.most_similar(positive='говно_NOUN', topn=5)
[('дерьмо_NOUN', 0.8184361457824707),
 ('гавный_ADV', 0.7093496918678284),
 ('говнище_NOUN', 0.6976292133331299),
 ('говнецо_NOUN', 0.6850547194480896),
 ('гуано_NOUN', 0.6759455800056458)]
model.wv.most_similar(positive='зонд_NOUN', topn=5)
[('гуглозонд_NOUN', 0.6018263697624207),
 ('зонт_NOUN', 0.5945577621459961),
 ('телеметрия_NOUN', 0.567317008972168),
 ('анальный_ADJ', 0.5619350671768188),
 ('огораживание_NOUN', 0.5601028203964233)]
model.wv.most_similar(positive='раст_NOUN', topn=5)
[('раста_NOUN', 0.7719116806983948),
 ('rust_NOUN', 0.7233066558837891),
 ('rust_CONJ', 0.7073013782501221),
 ('rust_PUNCT', 0.701453447341919),
 ('руст_NOUN', 0.6895651817321777)]
model.wv.most_similar(positive='си_NOUN', topn=5)
[('c_NOUN', 0.7338270545005798),
 ('сишный_ADJ', 0.7080429792404175),
 ('сишко_NOUN', 0.7051551938056946),
 ('сишечка_NOUN', 0.7004752159118652),
 ('паскаль_NOUN', 0.6833376884460449)]
model.wv.most_similar(positive='хаскел_NOUN', topn=5)
[('хаскелла_NOUN', 0.6159344911575317),
 ('окамл_NOUN', 0.580714225769043),
 ('кложур_NOUN', 0.5619770884513855),
 ('хаскель_NOUN', 0.5588544607162476),
 ('окамля_NOUN', 0.5533505082130432)]
model.wv.most_similar(positive='жаба_NOUN', topn=5)
[('джава_NOUN', 0.71211838722229),
 ('жава_NOUN', 0.6997002363204956),
 ('ява_NOUN', 0.6793997287750244),
 ('жабка_NOUN', 0.6773425936698914),
 ('жавый_ADJ', 0.6263688802719116)]
model.wv.most_similar(positive='системд_NOUN', topn=5)
[('systemd_NOUN', 0.747096061706543),
 ('systemd_ADV', 0.7364323139190674),
 ('инит_NOUN', 0.7345833778381348),
 ('сустемд_NOUN', 0.7294409275054932),
 ('апстарт_NOUN', 0.7225962281227112)]

Явной связи делириума с лгбт пока не обнаружено. Я спать.

Ах да:

model.wv.most_similar(positive='потуга_NOUN', topn=5)
[('балабольство_NOUN', 0.6964146494865417),
 ('обсёр_NOUN', 0.6956055164337158),
 ('балаболка_NOUN', 0.6849945187568665),
 ('кукаретинг_NOUN', 0.6816418170928955),
 ('балабол_NOUN', 0.6807647943496704)]

Слово-детектор в общем.

Исправление shkolnick-kun, :

В общем, word2vec 10 эпох:

model.wv.most_similar(positive='хвостострел_NOUN', topn=5)
[('модёр_NOUN', 0.6396694183349609),
 ('мочератор_NOUN', 0.6092097759246826),
 ('модеры_NOUN', 0.6014557480812073),
 ('жобэ_NOUN', 0.6006250381469727),
 ('банхаммер_NOUN', 0.5871785879135132)]
model.wv.most_similar(positive='кащенко_NOUN', topn=5)
[('кащенка_NOUN', 0.6909999251365662),
 ('кащенок_NOUN', 0.626151442527771),
 ('кащенко_ADV', 0.6231484413146973),
 ('ckotinko_PUNCT', 0.6163461804389954),
 ('сорримак_NOUN', 0.6158071160316467)]
model.wv.most_similar(positive='шрифт_NOUN', topn=5)
[('sans_CONJ', 0.7265832424163818),
 ('terminus_ADV', 0.7256990671157837),
 ('liberation_PUNCT', 0.7195568084716797),
 ('шревт_NOUN', 0.7151879072189331),
 ('arial_PUNCT', 0.7134194374084473)]
model.wv.most_similar(positive='говно_NOUN', topn=5)
[('дерьмо_NOUN', 0.8184361457824707),
 ('гавный_ADV', 0.7093496918678284),
 ('говнище_NOUN', 0.6976292133331299),
 ('говнецо_NOUN', 0.6850547194480896),
 ('гуано_NOUN', 0.6759455800056458)]
model.wv.most_similar(positive='зонд_NOUN', topn=5)
[('гуглозонд_NOUN', 0.6018263697624207),
 ('зонт_NOUN', 0.5945577621459961),
 ('телеметрия_NOUN', 0.567317008972168),
 ('анальный_ADJ', 0.5619350671768188),
 ('огораживание_NOUN', 0.5601028203964233)]
model.wv.most_similar(positive='раст_NOUN', topn=5)
[('раста_NOUN', 0.7719116806983948),
 ('rust_NOUN', 0.7233066558837891),
 ('rust_CONJ', 0.7073013782501221),
 ('rust_PUNCT', 0.701453447341919),
 ('руст_NOUN', 0.6895651817321777)]
model.wv.most_similar(positive='си_NOUN', topn=5)
[('c_NOUN', 0.7338270545005798),
 ('сишный_ADJ', 0.7080429792404175),
 ('сишко_NOUN', 0.7051551938056946),
 ('сишечка_NOUN', 0.7004752159118652),
 ('паскаль_NOUN', 0.6833376884460449)]
model.wv.most_similar(positive='хаскел_NOUN', topn=5)
[('хаскелла_NOUN', 0.6159344911575317),
 ('окамл_NOUN', 0.580714225769043),
 ('кложур_NOUN', 0.5619770884513855),
 ('хаскель_NOUN', 0.5588544607162476),
 ('окамля_NOUN', 0.5533505082130432)]
model.wv.most_similar(positive='жаба_NOUN', topn=5)
[('джава_NOUN', 0.71211838722229),
 ('жава_NOUN', 0.6997002363204956),
 ('ява_NOUN', 0.6793997287750244),
 ('жабка_NOUN', 0.6773425936698914),
 ('жавый_ADJ', 0.6263688802719116)]
model.wv.most_similar(positive='системд_NOUN', topn=5)
[('systemd_NOUN', 0.747096061706543),
 ('systemd_ADV', 0.7364323139190674),
 ('инит_NOUN', 0.7345833778381348),
 ('сустемд_NOUN', 0.7294409275054932),
 ('апстарт_NOUN', 0.7225962281227112)]

Явной связи делириума с лгбт пока не обнаружено. Я спать.

Исходная версия shkolnick-kun, :

В общем, word2vec 10 эпох:

model.wv.most_similar(positive='хвостострел_NOUN', topn=5)
[('модёр_NOUN', 0.6396694183349609),
 ('мочератор_NOUN', 0.6092097759246826),
 ('модеры_NOUN', 0.6014557480812073),
 ('жобэ_NOUN', 0.6006250381469727),
 ('банхаммер_NOUN', 0.5871785879135132)]
model.wv.most_similar(positive='кащенко_NOUN', topn=5)
[('кащенка_NOUN', 0.6909999251365662),
 ('кащенок_NOUN', 0.626151442527771),
 ('кащенко_ADV', 0.6231484413146973),
 ('ckotinko_PUNCT', 0.6163461804389954),
 ('сорримак_NOUN', 0.6158071160316467)]
model.wv.most_similar(positive='шрифт_NOUN', topn=5)
[('sans_CONJ', 0.7265832424163818),
 ('terminus_ADV', 0.7256990671157837),
 ('liberation_PUNCT', 0.7195568084716797),
 ('шревт_NOUN', 0.7151879072189331),
 ('arial_PUNCT', 0.7134194374084473)]
model.wv.most_similar(positive='говно_NOUN', topn=5)
[('дерьмо_NOUN', 0.8184361457824707),
 ('гавный_ADV', 0.7093496918678284),
 ('говнище_NOUN', 0.6976292133331299),
 ('говнецо_NOUN', 0.6850547194480896),
 ('гуано_NOUN', 0.6759455800056458)]
model.wv.most_similar(positive='зонд_NOUN', topn=5)
[('гуглозонд_NOUN', 0.6018263697624207),
 ('зонт_NOUN', 0.5945577621459961),
 ('телеметрия_NOUN', 0.567317008972168),
 ('анальный_ADJ', 0.5619350671768188),
 ('огораживание_NOUN', 0.5601028203964233)]
model.wv.most_similar(positive='раст_NOUN', topn=5)
[('раста_NOUN', 0.7719116806983948),
 ('rust_NOUN', 0.7233066558837891),
 ('rust_CONJ', 0.7073013782501221),
 ('rust_PUNCT', 0.701453447341919),
 ('руст_NOUN', 0.6895651817321777)]
model.wv.most_similar(positive='си_NOUN', topn=5)
[('c_NOUN', 0.7338270545005798),
 ('сишный_ADJ', 0.7080429792404175),
 ('сишко_NOUN', 0.7051551938056946),
 ('сишечка_NOUN', 0.7004752159118652),
 ('паскаль_NOUN', 0.6833376884460449)]
model.wv.most_similar(positive='хаскел_NOUN', topn=5)
[('хаскелла_NOUN', 0.6159344911575317),
 ('окамл_NOUN', 0.580714225769043),
 ('кложур_NOUN', 0.5619770884513855),
 ('хаскель_NOUN', 0.5588544607162476),
 ('окамля_NOUN', 0.5533505082130432)]
model.wv.most_similar(positive='жаба_NOUN', topn=5)
[('джава_NOUN', 0.71211838722229),
 ('жава_NOUN', 0.6997002363204956),
 ('ява_NOUN', 0.6793997287750244),
 ('жабка_NOUN', 0.6773425936698914),
 ('жавый_ADJ', 0.6263688802719116)]
model.wv.most_similar(positive='системд_NOUN', topn=5)
[('systemd_NOUN', 0.747096061706543),
 ('systemd_ADV', 0.7364323139190674),
 ('инит_NOUN', 0.7345833778381348),
 ('сустемд_NOUN', 0.7294409275054932),
 ('апстарт_NOUN', 0.7225962281227112)]