React + Flask + Python + MongoDBで作るRSSリーダー

これまで２回に渡ってReactについて学んできた。 testpy.hatenablog.com testpy.hatenablog.com 僕は普段、Pythonを使って機械学習やデータ解析のコードを実装してるのだが、 Webアプリ化したいな、できればReactで実現できたらいいな、と思うことが度々あっ…

2016-10-30

Reactチュートリアル入門： Pythonサーバーサイド連携編

チュートリアル | React がなくなったようで。。良いチュートリアルだったのに。。まあとりあえず、前回はクライアントサイドのみでWebサイトを表示したので、今回はサーバーサイドで取得したデータをクライアントサイドに渡して表示させる。とは言って…

2016-10-24

Reactチュートリアル入門：クライアントサイド編

チュートリアル | React（何故か2016-10-23時点ではNot Found）を理解しながら写経すると、Reactで簡単なWebアプリが作れるようになる。しかし、僕自身もそうだが、テンプレートを使ったWebアプリしか作ったことしかなく、 Reactを理解したいという人向け…

2016-10-23

Atomがフリーズしたときの対処法

macOS Sierraにアップデートしたら、"Editor is not responding"となったので、その対処法をメモに残しておく。手順 Finderのメニューバーから、[移動] > [フォルダーへ移動...]と選択テキストボックスに<~/.atom/storage>を入力して[移動]ボタンをクリッ…

2016-10-11

Python製プログレスバーを３行で書く

for文の中に標準出力を書くと、ターミナルが文字で埋め尽くされるので回避したいが、 for文の中身が重くて無反応になるのも困る。なのでプログレスバーを書けば良い、という結論に至るわけだが、さくっと色んなfor文に書きたいので、３行で書く方法を説明…

2016-10-10

Luhnの要約アルゴリズムの後処理

これまでLuhnの要約アルゴリズムの前処理として基本的な自然言語処理を、本処理としてテキストの各文のスコア付けを行った。今回は後処理として要約テキストとして表示させる。要約テキストは、スコア付けされた文を選択することで生成される。ここでは…

2016-10-09

Luhnの要約アルゴリズムの本処理

Luhnの要約アルゴリズムの前処理の続き。記事本文を"。"で分割して文のリストにし、さらに英語を小文字化したのがnormalized_sents（以下、sents）だった。ここでは、分割された各文がどのようにスコア付けされるかを見ていく。文を単語に分割する今回は…

2016-10-08

Luhnの要約アルゴリズムの前処理

入門ソーシャルデータ ―データマイニング、分析、可視化のテクニック作者: Matthew A. Russell,奥野陽（監訳）,佐藤敏紀（監訳）,瀬戸口光宏（監訳）,原川浩一（監訳）,水野貴明（監訳）,長尾高弘出版社/メーカー: オライリージャパン発売日: 2011/11/26メ…

2016-10-05

簡易的な日本語ストップワードの取得メソッド

それほど厳密に調査した訳ではないが、NLTKのコーパスには日本語のストップワードが存在しないようで、多くの人は SlothLib を利用している、という印象をWebから受けた。 SlothLibのように単語ベースでストップワードを定義している一方で、 IBM Content An…

2016-10-04

MeCab-Pythonで分かち書きと形態素解析

MeCabでwakatiとchasenを使うと、それぞれ分かち書きと形態素解析ができる。これらの結果を利用しやすくするために、前者は単語のリスト、後者は単語と品詞のセットのリストとして取得できるようにした。分かち書きまずはMeCabの使い方から。最初は分かち…

2016-10-03

新規リポジトリー同期のためのGitHub Desktop

GitHub Desktopを使って、GitHubで作った新規リポジトリーをローカルと同期させるための手順をまとめた。手順ローカルでファイル作成 GitHubでリポジトリー作成 GitHubのリポジトリーにファイルをアップロード GitHub DesktopでGitHubのリポジトリーをクロ…

2016-10-02

GIGAZINEの記事をPythonでスクレイピング

前回、 GIGAZINEのRSSをDBに保存した。今回はソースから本文を抽出してDBに保存する。 urllib2でソースを取得リンクからソースを取得するには、urllib2.urlopen()を使うのが早い。 articleのlinkを渡す。取得したソースは、idをファイル名にして保存する。 …

test.py

2016-10-01から1ヶ月間の記事一覧