История изменений
Исправление shkolnick-kun, (текущая версия) :
В общем, word2vec 10 эпох:
model.wv.most_similar(positive='хвостострел_NOUN', topn=5)
[('модёр_NOUN', 0.6396694183349609),
('мочератор_NOUN', 0.6092097759246826),
('модеры_NOUN', 0.6014557480812073),
('жобэ_NOUN', 0.6006250381469727),
('банхаммер_NOUN', 0.5871785879135132)]
model.wv.most_similar(positive='кащенко_NOUN', topn=5)
[('кащенка_NOUN', 0.6909999251365662),
('кащенок_NOUN', 0.626151442527771),
('кащенко_ADV', 0.6231484413146973),
('ckotinko_PUNCT', 0.6163461804389954),
('сорримак_NOUN', 0.6158071160316467)]
model.wv.most_similar(positive='шрифт_NOUN', topn=5)
[('sans_CONJ', 0.7265832424163818),
('terminus_ADV', 0.7256990671157837),
('liberation_PUNCT', 0.7195568084716797),
('шревт_NOUN', 0.7151879072189331),
('arial_PUNCT', 0.7134194374084473)]
model.wv.most_similar(positive='говно_NOUN', topn=5)
[('дерьмо_NOUN', 0.8184361457824707),
('гавный_ADV', 0.7093496918678284),
('говнище_NOUN', 0.6976292133331299),
('говнецо_NOUN', 0.6850547194480896),
('гуано_NOUN', 0.6759455800056458)]
model.wv.most_similar(positive='зонд_NOUN', topn=5)
[('гуглозонд_NOUN', 0.6018263697624207),
('зонт_NOUN', 0.5945577621459961),
('телеметрия_NOUN', 0.567317008972168),
('анальный_ADJ', 0.5619350671768188),
('огораживание_NOUN', 0.5601028203964233)]
model.wv.most_similar(positive='раст_NOUN', topn=5)
[('раста_NOUN', 0.7719116806983948),
('rust_NOUN', 0.7233066558837891),
('rust_CONJ', 0.7073013782501221),
('rust_PUNCT', 0.701453447341919),
('руст_NOUN', 0.6895651817321777)]
model.wv.most_similar(positive='си_NOUN', topn=5)
[('c_NOUN', 0.7338270545005798),
('сишный_ADJ', 0.7080429792404175),
('сишко_NOUN', 0.7051551938056946),
('сишечка_NOUN', 0.7004752159118652),
('паскаль_NOUN', 0.6833376884460449)]
model.wv.most_similar(positive='хаскел_NOUN', topn=5)
[('хаскелла_NOUN', 0.6159344911575317),
('окамл_NOUN', 0.580714225769043),
('кложур_NOUN', 0.5619770884513855),
('хаскель_NOUN', 0.5588544607162476),
('окамля_NOUN', 0.5533505082130432)]
model.wv.most_similar(positive='жаба_NOUN', topn=5)
[('джава_NOUN', 0.71211838722229),
('жава_NOUN', 0.6997002363204956),
('ява_NOUN', 0.6793997287750244),
('жабка_NOUN', 0.6773425936698914),
('жавый_ADJ', 0.6263688802719116)]
model.wv.most_similar(positive='системд_NOUN', topn=5)
[('systemd_NOUN', 0.747096061706543),
('systemd_ADV', 0.7364323139190674),
('инит_NOUN', 0.7345833778381348),
('сустемд_NOUN', 0.7294409275054932),
('апстарт_NOUN', 0.7225962281227112)]
Явной связи делириума с лгбт пока не обнаружено. Я спать.
Ах да:
model.wv.most_similar(positive='потуга_NOUN', topn=5)
[('балабольство_NOUN', 0.6964146494865417),
('обсёр_NOUN', 0.6956055164337158),
('балаболка_NOUN', 0.6849945187568665),
('кукаретинг_NOUN', 0.6816418170928955),
('балабол_NOUN', 0.6807647943496704)]
Слово-детектор в общем.
Исправление shkolnick-kun, :
В общем, word2vec 10 эпох:
model.wv.most_similar(positive='хвостострел_NOUN', topn=5)
[('модёр_NOUN', 0.6396694183349609),
('мочератор_NOUN', 0.6092097759246826),
('модеры_NOUN', 0.6014557480812073),
('жобэ_NOUN', 0.6006250381469727),
('банхаммер_NOUN', 0.5871785879135132)]
model.wv.most_similar(positive='кащенко_NOUN', topn=5)
[('кащенка_NOUN', 0.6909999251365662),
('кащенок_NOUN', 0.626151442527771),
('кащенко_ADV', 0.6231484413146973),
('ckotinko_PUNCT', 0.6163461804389954),
('сорримак_NOUN', 0.6158071160316467)]
model.wv.most_similar(positive='шрифт_NOUN', topn=5)
[('sans_CONJ', 0.7265832424163818),
('terminus_ADV', 0.7256990671157837),
('liberation_PUNCT', 0.7195568084716797),
('шревт_NOUN', 0.7151879072189331),
('arial_PUNCT', 0.7134194374084473)]
model.wv.most_similar(positive='говно_NOUN', topn=5)
[('дерьмо_NOUN', 0.8184361457824707),
('гавный_ADV', 0.7093496918678284),
('говнище_NOUN', 0.6976292133331299),
('говнецо_NOUN', 0.6850547194480896),
('гуано_NOUN', 0.6759455800056458)]
model.wv.most_similar(positive='зонд_NOUN', topn=5)
[('гуглозонд_NOUN', 0.6018263697624207),
('зонт_NOUN', 0.5945577621459961),
('телеметрия_NOUN', 0.567317008972168),
('анальный_ADJ', 0.5619350671768188),
('огораживание_NOUN', 0.5601028203964233)]
model.wv.most_similar(positive='раст_NOUN', topn=5)
[('раста_NOUN', 0.7719116806983948),
('rust_NOUN', 0.7233066558837891),
('rust_CONJ', 0.7073013782501221),
('rust_PUNCT', 0.701453447341919),
('руст_NOUN', 0.6895651817321777)]
model.wv.most_similar(positive='си_NOUN', topn=5)
[('c_NOUN', 0.7338270545005798),
('сишный_ADJ', 0.7080429792404175),
('сишко_NOUN', 0.7051551938056946),
('сишечка_NOUN', 0.7004752159118652),
('паскаль_NOUN', 0.6833376884460449)]
model.wv.most_similar(positive='хаскел_NOUN', topn=5)
[('хаскелла_NOUN', 0.6159344911575317),
('окамл_NOUN', 0.580714225769043),
('кложур_NOUN', 0.5619770884513855),
('хаскель_NOUN', 0.5588544607162476),
('окамля_NOUN', 0.5533505082130432)]
model.wv.most_similar(positive='жаба_NOUN', topn=5)
[('джава_NOUN', 0.71211838722229),
('жава_NOUN', 0.6997002363204956),
('ява_NOUN', 0.6793997287750244),
('жабка_NOUN', 0.6773425936698914),
('жавый_ADJ', 0.6263688802719116)]
model.wv.most_similar(positive='системд_NOUN', topn=5)
[('systemd_NOUN', 0.747096061706543),
('systemd_ADV', 0.7364323139190674),
('инит_NOUN', 0.7345833778381348),
('сустемд_NOUN', 0.7294409275054932),
('апстарт_NOUN', 0.7225962281227112)]
Явной связи делириума с лгбт пока не обнаружено. Я спать.
Ах да:
model.wv.most_similar(positive='потуга_NOUN', topn=5)
[('балабольство_NOUN', 0.6964146494865417),
('обсёр_NOUN', 0.6956055164337158),
('балаболка_NOUN', 0.6849945187568665),
('кукаретинг_NOUN', 0.6816418170928955),
('балабол_NOUN', 0.6807647943496704)]
Слово-детектор в общем.
Исправление shkolnick-kun, :
В общем, word2vec 10 эпох:
model.wv.most_similar(positive='хвостострел_NOUN', topn=5)
[('модёр_NOUN', 0.6396694183349609),
('мочератор_NOUN', 0.6092097759246826),
('модеры_NOUN', 0.6014557480812073),
('жобэ_NOUN', 0.6006250381469727),
('банхаммер_NOUN', 0.5871785879135132)]
model.wv.most_similar(positive='кащенко_NOUN', topn=5)
[('кащенка_NOUN', 0.6909999251365662),
('кащенок_NOUN', 0.626151442527771),
('кащенко_ADV', 0.6231484413146973),
('ckotinko_PUNCT', 0.6163461804389954),
('сорримак_NOUN', 0.6158071160316467)]
model.wv.most_similar(positive='шрифт_NOUN', topn=5)
[('sans_CONJ', 0.7265832424163818),
('terminus_ADV', 0.7256990671157837),
('liberation_PUNCT', 0.7195568084716797),
('шревт_NOUN', 0.7151879072189331),
('arial_PUNCT', 0.7134194374084473)]
model.wv.most_similar(positive='говно_NOUN', topn=5)
[('дерьмо_NOUN', 0.8184361457824707),
('гавный_ADV', 0.7093496918678284),
('говнище_NOUN', 0.6976292133331299),
('говнецо_NOUN', 0.6850547194480896),
('гуано_NOUN', 0.6759455800056458)]
model.wv.most_similar(positive='зонд_NOUN', topn=5)
[('гуглозонд_NOUN', 0.6018263697624207),
('зонт_NOUN', 0.5945577621459961),
('телеметрия_NOUN', 0.567317008972168),
('анальный_ADJ', 0.5619350671768188),
('огораживание_NOUN', 0.5601028203964233)]
model.wv.most_similar(positive='раст_NOUN', topn=5)
[('раста_NOUN', 0.7719116806983948),
('rust_NOUN', 0.7233066558837891),
('rust_CONJ', 0.7073013782501221),
('rust_PUNCT', 0.701453447341919),
('руст_NOUN', 0.6895651817321777)]
model.wv.most_similar(positive='си_NOUN', topn=5)
[('c_NOUN', 0.7338270545005798),
('сишный_ADJ', 0.7080429792404175),
('сишко_NOUN', 0.7051551938056946),
('сишечка_NOUN', 0.7004752159118652),
('паскаль_NOUN', 0.6833376884460449)]
model.wv.most_similar(positive='хаскел_NOUN', topn=5)
[('хаскелла_NOUN', 0.6159344911575317),
('окамл_NOUN', 0.580714225769043),
('кложур_NOUN', 0.5619770884513855),
('хаскель_NOUN', 0.5588544607162476),
('окамля_NOUN', 0.5533505082130432)]
model.wv.most_similar(positive='жаба_NOUN', topn=5)
[('джава_NOUN', 0.71211838722229),
('жава_NOUN', 0.6997002363204956),
('ява_NOUN', 0.6793997287750244),
('жабка_NOUN', 0.6773425936698914),
('жавый_ADJ', 0.6263688802719116)]
model.wv.most_similar(positive='системд_NOUN', topn=5)
[('systemd_NOUN', 0.747096061706543),
('systemd_ADV', 0.7364323139190674),
('инит_NOUN', 0.7345833778381348),
('сустемд_NOUN', 0.7294409275054932),
('апстарт_NOUN', 0.7225962281227112)]
Явной связи делириума с лгбт пока не обнаружено. Я спать.
Исходная версия shkolnick-kun, :
В общем, word2vec 10 эпох:
model.wv.most_similar(positive='хвостострел_NOUN', topn=5)
[('модёр_NOUN', 0.6396694183349609),
('мочератор_NOUN', 0.6092097759246826),
('модеры_NOUN', 0.6014557480812073),
('жобэ_NOUN', 0.6006250381469727),
('банхаммер_NOUN', 0.5871785879135132)]
model.wv.most_similar(positive='кащенко_NOUN', topn=5)
[('кащенка_NOUN', 0.6909999251365662),
('кащенок_NOUN', 0.626151442527771),
('кащенко_ADV', 0.6231484413146973),
('ckotinko_PUNCT', 0.6163461804389954),
('сорримак_NOUN', 0.6158071160316467)]
model.wv.most_similar(positive='шрифт_NOUN', topn=5)
[('sans_CONJ', 0.7265832424163818),
('terminus_ADV', 0.7256990671157837),
('liberation_PUNCT', 0.7195568084716797),
('шревт_NOUN', 0.7151879072189331),
('arial_PUNCT', 0.7134194374084473)]
model.wv.most_similar(positive='говно_NOUN', topn=5)
[('дерьмо_NOUN', 0.8184361457824707),
('гавный_ADV', 0.7093496918678284),
('говнище_NOUN', 0.6976292133331299),
('говнецо_NOUN', 0.6850547194480896),
('гуано_NOUN', 0.6759455800056458)]
model.wv.most_similar(positive='зонд_NOUN', topn=5)
[('гуглозонд_NOUN', 0.6018263697624207),
('зонт_NOUN', 0.5945577621459961),
('телеметрия_NOUN', 0.567317008972168),
('анальный_ADJ', 0.5619350671768188),
('огораживание_NOUN', 0.5601028203964233)]
model.wv.most_similar(positive='раст_NOUN', topn=5)
[('раста_NOUN', 0.7719116806983948),
('rust_NOUN', 0.7233066558837891),
('rust_CONJ', 0.7073013782501221),
('rust_PUNCT', 0.701453447341919),
('руст_NOUN', 0.6895651817321777)]
model.wv.most_similar(positive='си_NOUN', topn=5)
[('c_NOUN', 0.7338270545005798),
('сишный_ADJ', 0.7080429792404175),
('сишко_NOUN', 0.7051551938056946),
('сишечка_NOUN', 0.7004752159118652),
('паскаль_NOUN', 0.6833376884460449)]
model.wv.most_similar(positive='хаскел_NOUN', topn=5)
[('хаскелла_NOUN', 0.6159344911575317),
('окамл_NOUN', 0.580714225769043),
('кложур_NOUN', 0.5619770884513855),
('хаскель_NOUN', 0.5588544607162476),
('окамля_NOUN', 0.5533505082130432)]
model.wv.most_similar(positive='жаба_NOUN', topn=5)
[('джава_NOUN', 0.71211838722229),
('жава_NOUN', 0.6997002363204956),
('ява_NOUN', 0.6793997287750244),
('жабка_NOUN', 0.6773425936698914),
('жавый_ADJ', 0.6263688802719116)]
model.wv.most_similar(positive='системд_NOUN', topn=5)
[('systemd_NOUN', 0.747096061706543),
('systemd_ADV', 0.7364323139190674),
('инит_NOUN', 0.7345833778381348),
('сустемд_NOUN', 0.7294409275054932),
('апстарт_NOUN', 0.7225962281227112)]