数学が好きなサラリーマンのブログ

数学が好きなサラリーマンのブログです。数学ネタから大学受験数学、ビジネスやライフスタイルまで数学が好きなサラリーマンの頭の中を大公開しています。

日記を書こうよ(そしてテキストマイニング)

f:id:mathbanker:20180928205211p:plain

実はそこそこの期間、平日のみだけど毎日日記を書いている

 

昔から妄想癖があるというか、色々なことを思い描いたり、閃いたりするのだが、時間が経つとすっかり忘れてしまう。あのときいいことを思いついたのに、それが何だったのかが思い出せない・・ということがもったいなくて、日々の出来事を残すというよりは、その日考えていたことをメモしておくスタンスで続けている。

 

平日のみにしているのは、休日は決まった過ごし方をしていないので、書く余裕がない日がくることは簡単に予想ができるからだ。ポツポツ抜けるよりは、いっそルール化して書かない日を設けたほうが、毎日書かなきゃというプレッシャーからも開放される

 

スキマ時間とかにどこでもサラッと書けるような環境じゃないと性格上長く持たないので、Evernoteに書くようにしている。こうすることで、通勤電車やランチタイムなどにスマホから、もしくはカフェにはいったときにPCで腰据えてとマルチデバイスでそこにある端末から更新することができる

 

Evernoteの中にDIARYというブックを作って、タイトルを日付だけにして本文にいろいろと書いていくスタイルだ。自分しか読まない前提なので、思いつくままに書いていくし、水平線で区切りながら短文でいくつかのテーマに触れることもある。

 

しかし、最近ふと気づいてしまった。自分しか読まない前提をおいているが、実際は自分ですらほとんど読んでいない。極稀にあのとき考えてたことを知りたいと思うことがあって、そんなときには役に立つが、それに対する日々のエフォートがなかなかなものになっている

 

ということで、有効活用できないかなと考えた結果思いついたのが、テキストマイニング。簡単にいうと、客観的に自分の日記の傾向分析をすることができる

 

テキストマイニングなんて知らないよという人のために、Wikipediaの説明は以下の通りだ。

 

テキストマイニング(英: text mining)は、文字列を対象としたデータマイニングのことである。 通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である。

 

分析手法について、深く学ぶと面白い世界が広がっているが、とりあえずツールで遊んで見るだけでもわかることは多いし、十分楽しい。 ボクは、

KH Coder: 計量テキスト分析・テキストマイニングのためのフリーソフトウェア

がお気に入りだ。

 

世の中には色々な自己分析ツールがあるが、その多くが事前に何らかのアンケート的なものに答えて、それを用いて統計的なアプローチで分析結果を提供するスタイルになっている。

 

それに対し、日記のテキストマイニングの分析結果は異なるものを教えてくれる。どんな語句をどんな言葉とともに用いていて、方向性としてどんなことを考えているのかが見えてくる。他人のグループから得られた自分の統計的傾向ではなく、自分が選び紡いだ文章のみから得られる傾向なので、まるで自分の体にメスをいれるような感覚だ

 

分析結果をここで公表するほどの勇気は今のところないが、この試みは非常におもしろかった(気が変わったらそのうち晒すかも)。日記を書いている人には是非やってもらいたいし、なんだったらこの為に日記を書いていなかった人も日記を始めてもらいたい

 

ボクは一年に一度のお楽しみにしようかな。

 

 

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

 
数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)