RSS
Admin
Archives

毎日ぴよぴよ

勉強したことと日常を書いていきます! まだまだひよこちゃん(`・ω・´)

プロフィール

ぱっぱ

Author:ぱっぱ
ITの会社で働くおんなのこです。
最近ひかりテレビでアニメばっかりみてます。

CakePHPとjQueryをお勉強中。


BUMPが好き。
アイスが好き。
音楽聞きながらの出勤は嫌いじゃない。

最新記事
月別アーカイブ
カテゴリ
検索フォーム
QRコード
QRコード
Powered by fc2 blog  |  Designed by sebek
--.--
--


--:--
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
2011.01
19
Category : 卒研
覚え書きみたいな感じ。



Twitterから取得したTLデータをMeCabの形態素解析にかけると、大抵の固有名詞は単語がバラバラになってしまいます。

形態素1

バラバラになってしまった「嵐にしやがれ」

これを、固有名詞と判断させるためにどうしたらいいのか。

はてなキーワードwikipediaのタイトルをMeCabの辞書にぶっこんであげればよし。

ということでがんばってみた。
*続きを読む!
スポンサーサイト
2010.11
10
Category : 卒研
■経過報告
・リプライごと
・ハッシュダグごと
・写真ごと

には、とりあえず正規表現を使ってなんとなくTLから取得できたので、次の段階へ!


■とりあえず、「OAuth」について調べてみた。

●OAuthとは。
 あらかじめ信頼関係を構築したサービス間で
 ユーザ同意のもとに
 セキュアにユーザ権限の受け渡しをする

 
 ほうほう。
 
 つまり、ユーザがIDとパスワードを教えなくても
 アクセス権を安全に渡して、第三者のサービスから利用出来る
ようにできるらしい。

 【参考】
 ゼロから学ぶOAuth
 ハブろぐ
 

●とりあえず、こちら様の通りに実装してみた。

 TwitterへOAuthクライアントの登録をするために、
 http://twitter.com/sottuken
 を登録。

 ここで、登録されたときに発行される
 "Consumer key"と"Consumer secret"が重要。
 (アプリケーションの識別IDとパスワードのようなもの)
 のちにコピペして使う。




■PHPでOAuthを使う準備

●curlが使えないとダメらしい
 「php.ini」 の中の
 「;extension=php_curl.dll」⇒「extension=php_curl.dll」にする。

もちろんApacheを再起動させる

●「OAuth.php」と「twitteroauth.php」を使う。
 abraham's twitteroauth at master - GitHub から取ってくる。
 「0.2.0-beta3」を取ってきた。
(バージョン0.2.0以降がいいらしい)
 開いて、卒研フォルダに突っ込む。えいっと。


●PHP+OAuthでTwitterにPOSTしてみる
 ほんとに動くのかテスト!
 サンプルコードを元に、
 consumer_key
 consumer_secret
 access_token
 access_token_secret

 の値を書き換える。
 
 ここらへんのことはあとでもうちょい詳しく勉強したいなと思う。
 
 そしたらできた!
sotuken1.png


 オォォーーー!! w(゚ロ゚;w(゚ロ゚)w;゚ロ゚)w オォォーーー!!
 

 このまま調子よく、OAuth経由でTLも取得できるかー!と思ったけど、ここでエラーがでて、詰まってる。


 
 
 
 なんとかなりそうなので、いけそうなとこまでがんばります。
 なんとかなってる!

 動くとモチベーションが上がるんですね。
 モチベーションというよりテンションがですね。
2010.10
27
Category : 卒研

自動分類を行うために読まなきゃいけない本がある


集合知プログラミング集合知プログラミング
(2008/07/25)
Toby Segaran

商品詳細を見る




これはなかなかしんどい。
中のコードはPython。
言ってることもよくわかんない。
英語を翻訳しましたね的な文章。
訳のわからない数式。

これと11月に戦うことが目標です。
読める気がしな・・・いや、がんばるんだ
2010.10
27
Category : 卒研
卒研の方向性が
「発想支援」→「分類整理」に移行したことにより
卒研ネタノートを見返していろいろ考えなおしてみた。


そもそもですね
なんでこの卒研をテーマにしたかというとですよ。

春に急に思いついたのがきっかけでして。
Twitterを使っていて、勝手にタグ付けしてアーカイブしてくれるものがあればいいなあ!と思ったんです。
それがまとまると、自分が何の事柄について語っているのかが見えてきて
おもしろそーだなーって思ったんだよね

だから!
元々、「分類整理」をやりたくて、いつのまにか「発想支援」に流れてたんですね。

そう、だから原点回帰!



してさしてさ。
他人のも見れたら、それこそほんと面白いんじゃないか。


これのメリットは
思わぬ情報が手に入りやすいということ。
(また発想支援とかいうように流れていきそうでコワイw)

なんかね、イメージとしては
図書館に行って、適当にうろうろして
適当な本を手に取ったら、興味がぶわああって広がるような。


あの感じを、これからの卒研で実現していけたらいいなって、強く思います。




それらを実現するために、まとめリスト。
*続きを読む!
2010.10
25
Category : 卒研
10月までにやろうと思っている卒研の内容があるんだ。
10月がもう終わっちゃうんじゃないのとか、そうこともあるよね。

実は、卒研の方向性がちょっと変わった。

私の研究はもともと
Twitterの発言をまとめることによって、新しい発想ができないか
ということだったんだけど
中間発表で、それはちょっと可能性として難しいのではないかということになった。

確かに難しいのかも知れないけど、私としてはやってみたかった。

けれども、上手い方法がどうもみつからなくて、結局は「発想」ということに拘らず
Twitterの発言を如何にして「分類分け」するか
ということを中心に研究することにした。

元々、発想を促すためには、発想を刺激するような分類分けをしなければならないという課題があった。

まあ、最終目的地を変えただけであって、やることは同じなので
どこかで発想に結びつくことがあれば、自己満足でもいいからそれは嬉しいことなんじゃないかな。



で、話を戻すのだけど。
10月までにやろうと思っていること。

当初は、Javaで組む予定だったんだけど
会社ではPHPを使うことが多いので、勉強がてらPHPで組むことにしました。

-----------------------------

①PHPでTwitterAPIを使えるようにする
  ●自分のTLの取得
  ●条件を与えて分類できるか試してみる
     ・月ごと
     ・リプライごと
     ・RTごと
     ・etc...

②形態素解析
③辞書
  →Twitterで現れるような語彙をあらかじめ登録してくれるようなもの
   EX)「なう」「(`・ω・´)等の顔文字」「固有名詞」 等々
   *どこまでやるのか(範囲的な意味で)


-----------------------------



まだ①の途中。
あと1週間でやれるとこまでがんばろう0(`・ω・´)=〇
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。