接着剤の精進日記

競プロでの精進や研究に関係したことを書いていきます。

Wikipedia

Wikipediaのあるカテゴリーに属する記事のタイトルを取得する方法

はじめに Wikipediaのdumpデータを用いて,あるカテゴリに含まれる記事のタイトルを取得します. 環境 CentOS7 Python3.6 事前準備 まず,word2vec-wikification-pyをインストールします.pipでできます. Wikificationをしてみよう ~Wikipediaを利用した情…

Wikipediaコーパスを使った,word2vecのモデル作成

はじめに 今回は,word2vecのモデルをWikipediaの記事本文を使って作成していきます. 以下参考記事です.ほとんど以下の記事に沿って進めました. qiita.com 環境 Linux(CentOS7) Python3.6 今回はLinuxサーバ上で行いましたが,Macなどのターミナルでも同…