2012-01-01から1年間の記事一覧

cgiにおける文字コードの扱いとか

久々にcgi書いてたら文字コード周りでハマったので備忘録。Perlで日本語処理を書いてると文字コード周りでハマるのは誰もが一度は経験するはず。 慣れてくると、ちゃんとuse utf8 or encodingとbinmodeしてればいいんでしょ、となると思うんだけど、今回の敵…

正規表現での置換の際に配列を利用する

個人用メモ。perlで正規表現を用いた置換の際に、$1などの特殊変数が使えるのは常識レベルの話だと思います。 今回は特殊変数で、配列の内容が参照できるかを調べてみました。 my @map = ("a","b","c"); my $input = "2"; say $input; $input =~ s/(\d)/$map…

python-twitterでFriendsを全て獲得する

python-twitterにはGetFriends()というメソッドがあり、Friendsを獲得することができます。 しかし、apiの制限上最大100件までしかFriendsを獲得することができません。 そこで、このGetFriendsを変更することで、全てのFriendsを獲得することができるように…

windows で emacs shellを使う

先日からpython勉強し始めたのだが、なんとなくcygwin環境で開発していました。 実は今までcygwinはxで接続する用とrsyncするためぐらいにしか使っていませんでした。 開発環境として使うのは今回が初めて。 で、cygwinというかDOSプロンプトの都合上、横幅…

python-twitter使ってみた

たまには趣味のプログラミングするかってことでtwitter関連で何か作ってみることにした。 せっかくなので、最近興味のあったpythonに手を出してみることに。今日はとりあえず、python-twitterを使えるようになるところまでのお話。まずはpython-twitter(http…

日本語は本当に語順が自由な言語なのか?

最近twitterを見ていて気になったのが、 日本語は語順が自由だから… という表現。 確かに日本語の場合、英語の文型のような語順に対する強い制約は存在しない。 太郎が花子に本を貸した。 花子に太郎が本を貸した。 花子に本を太郎が貸した。 このように語順…

素性選択について

最近、素性選択について少し悩んでます。 素性選択とは、機械学習に素性を与える際に、利用できるものを全て使うのではなく、有効そうなもののみを利用することを言います。実は素性選択って機械学習において計算量以外でのメリットがあまりないのではないか…

はじめてみた…のだがここまでに既につまづいていた

専門的な話をするのに、twitterとかだと短すぎるし、mixiはそういう感じではないので、はてなを始めてみることにしました。 更新頻度は高くないと思いますが、備忘録的に活用していこうかと検討中です。実はtwitterと同じアカウント名を取ろうとしたのですが…