接着剤の精進日記

競プロでの精進や研究に関係したことを書いていきます。

Google Cloud Platform (GCP)でGPUを使えるようにする

はじめに GCPでGPUを使えるようにする際に幾つかハマったところがあったので残しておきます GCPアカウントの作成 はじめにGCPアカウントの作成を行います。 アカウント作成については以下の記事などを参照してください。 【GCP入門編・第2回】まずは、ここか…

CRFsuiteをバイナリディストリビューションを使用してインストールする

はじめに CRFsuiteをバイナリディストリビューションを使ってインストールします ソースファイルからバイナリをビルドする方法ではmakeが上手く行かなかったためこちらを試します 環境 Linux(CentOS7) インストール Linux用のバイナリディストリビューション…

論文メモ 「Joint Learning of the Embedding of Words and Entities for Named Entity Disambiguation」

Joint Learning of the Embedding of Words and Entities for Named Entity Disambiguation Ikuya Yamada, Hiroyuki Shindo, Hideaki Takeda, Yoshiyasu Takefuji The SIGNLL Conference on Computational Natural Language Learning (CoNLL), 2016 https://…

論文メモ 「Deep Joint Entity Disambiguation with Local Neural Attention」

Deep Joint Entity Disambiguation with Local Neural Attention Octavian-Eugen Ganea and Thomas Hofmann Proceedings ofthe 2017 Conference on Empirical Methods in Natural Language Processing, pages 2619–2629 Copenhagen, Denmark, September 7–11…

論文メモ 「複数言語複数タスクを扱う発話意図推定モデリングのための敵対的学習の検討」

複数言語複数タスクを扱う発話意図推定モデリングのための敵対的学習の検討 増村亮 篠原雄介 東中竜一郎 青野裕司 https://ipsj.ixsq.nii.ac.jp/ej/index.php?active_action=repository_view_main_item_detail&page_id=13&block_id=8&item_id=192747&item_no…

論文メモ 「意味役割付与のためのスパン選択モデル」

意味役割付与のためのスパン選択モデル 大内 啓樹 進藤 裕之 松本 裕治 研究報告自然言語処理(NL),2018-NL-236(9),1-13 (2018-07-02) , 2188-8779 https://ipsj.ixsq.nii.ac.jp/ej/index.php?active_action=repository_view_main_item_detail&page_id=13&b…

CentOS7にHDDを増設する

はじめに 今回はCentOS7にHDDを増設します。 2TB以上の場合領域を確保しないといけないらしく、そこで躓いたので備忘録として残しておきます。 環境 CentOS7 HDD 8TB ディスク取り付け 増設したいHDDを取り付けCentOS7を起動します。 今回はrootで作業しまし…

日本語WordNetで上位語を取得する

はじめに 日本語版WordNetを使って上位語を取得したかったので、やります。 参考記事 以下の記事を参考にしています。 おおよそのプログラムは以下の記事のものを利用させてもらいました。 日本語WordNetを使って、上位語を検索できるツールをpythonで作って…

Macでassert.h: No such file or directoryと言われたときの対処法

はじめに 急にヘッダファイルがインクルードできなくなったので対処法を備忘録として残しておきます。 前にもアップデートしたときにあったが、完全に忘れていたので。 環境 Mojave 10.14.4 Xcode 10.2 対処法 Xcode10以降は/usr/include にヘッダファイルを…

BERTを使ってみる

はじめに 最近流行りのBERTを使ってサンプルを動かしてみます。 参考ページ techblog.nhn-techorus.com 環境 CentOS7 python3.6 tensorflow1.12 はじめに 最初に作業ディレクトリを作ります mkdir bert_test cd bert_test 公式リポジトリのクローン git clon…

Mac PythonでSeleniumを動かしてみる

はじめに 題名の通りMac上でpythonを使ってSeleniumを動かしてみます 参考ページ qiita.com 環境 MacOS Mojave Python 3.5 必要なもの selenium chrome driver Seleniumのインストール pipでSeleniumのインストールができます. pip install selenium chrome…

Wikipediaのあるカテゴリーに属する記事のタイトルを取得する方法

はじめに Wikipediaのdumpデータを用いて,あるカテゴリに含まれる記事のタイトルを取得します. 環境 CentOS7 Python3.6 事前準備 まず,word2vec-wikification-pyをインストールします.pipでできます. Wikificationをしてみよう ~Wikipediaを利用した情…

ライブコーディング環境を導入してみた(TidalCycles)

はじめに ゼミでライブコーディングの話が出てたので,とりあえずやってみよう精神で導入して見ました. 環境 MacOS Sierra Python 3.6 homebrew tidal-bootstrapの導入 とりあえず公式サイトに行ってみる. https://tidalcycles.org/getting_started.html#ru…

Wikipediaコーパスを使った,word2vecのモデル作成

はじめに 今回は,word2vecのモデルをWikipediaの記事本文を使って作成していきます. 以下参考記事です.ほとんど以下の記事に沿って進めました. qiita.com 環境 Linux(CentOS7) Python3.6 今回はLinuxサーバ上で行いましたが,Macなどのターミナルでも同…

グラフィカルなエンティティリンキングサイト「Serelex」

はじめに 面白そうなサイトを知ったのでただ紹介すると言うだけです serelex.cental.be どんなサイト? 「Serelex」というサイトで Finds semantically related wordsとあるように ある単語を入力すると、その単語と意味的に繋がりのある語がグラフィカルに…

言語処理学会第24回年次大会(NLP2018)に参加してきました.

はじめに 3/12(月)~3/16(金)の間行われていた言語処理学会(NLP2018)に参加してきました。 言語処理学会への参加は聴講自体初めてでしたが、 いつのまにやら発表することになっていて、発表もしてきました。 初めての学会の参加+5日間フル参加したので疲れま…

Xonshを導入してみた

はじめに なぜ、Xonshを導入しようかと思ったかと言うと TwitterのTLで話題に上がってて気になったので導入してみることに。 何やら日本語の記事が少ないので売名ができるらしい 自分と同じように興味を持った人へのハードルを下げるために導入記事を書いて…

Kaggleのtitanic問題に挑戦

はじめに 機械学習やデータサイエンスの勉強をし始めてなんとなくわかってきたので、 アウトプットとしてKaggle初心者がTitanicチュートリアルに挑戦してみました。 Kaggleとは Kaggleは、世界中のデータサイエンティストに対し、企業からコンペ形式でお題を…

Pythonでニコニコ動画をスクレイピングしてまとめてみた。

はじめに 完全に趣味用だが、ニコニコ動画をスクレイピングしてみた。 内容としては、昨日一日で投稿された動画の一覧を取得し、 タイトル(動画への直リン付き)とサムネイルを表示するというものだ。 以下の画像のようなサイトとなっている。琴葉姉妹動画な…

ゼロからはじめるデータサイエンス 読了

データサイエンスについて学びたかったので ゼロからはじめるデータサイエンスを勉強し、2週間ほどで読了。 ざっくりとした感想と書評を書いていく。 どんな感じの本なのか まず、目次を見ると、 1章 イントロダクション 2章 Python速習コース 3章 データの…

Python リスト内包表記

リスト内包表記について リスト内包表記はPythonらしい書き方である。 言葉で表現すると、 ひとつ以上のイテレータからPythonデータ構造をコンパクトに作れる形式*1である。 内包表記を使えば、ループなどを簡潔に書けるし、この書き方のほうが高速。 詳しく…

Pythonの文字列操作 join

Pythonの文字列操作、joinについて。 勉強中、コードの中に return " ".join(result)というコードを発見。文字列操作はよく忘れるので、何だったかなと調べると 文字列リストを文字列に変換するものらしい。 なるほど、リストのままだと出力が面倒くさいし、…