Pumbokin
seen from China

seen from United States

seen from United States
seen from United States

seen from Italy
seen from China
seen from United Kingdom
seen from Türkiye

seen from Japan

seen from Türkiye
seen from France
seen from France
seen from France

seen from Hong Kong SAR China

seen from Yemen
seen from China
seen from Denmark
seen from France
seen from China
seen from Denmark
Pumbokin
Chegou para complementar o seu look. 👸 Corrente em malha veneziana, pingente trabalhado no ródio, com duas fileiras cravejadas de zircônias rosas, cabochão em gota na cor turquesa, caneta de ródio negro. Busque pelo código (3009054200145) _____________________💎💍🛍_____________________ #Rodio #Cabocha #Brinco #Semijoia #Anabijou #Turquesa #Semijoias #Anabijoustore #Tendencia2018 #Semijoiasdeluxo (em São Paulo, Brazil)
Curta esse lindo brinco Gota com Cabochão na cor turquesa. Um luxo para seu look. Trabalhado no ródio, com duas fileiras cravejadas de zircônias rosas, e cabochão em gota na cor turqueza. Busque pelo código (0209054200381) _____________________💎💍🛍_____________________ #rodio #brinco #cabocha #Semijoia #Anabijou #turquesa #Semijoias #Anabijoustore #Tendencia2018 #Semijoiasdeluxo
Cabochaを入れた
Cabocha
係り受け解析器
nlp100で使うのでローカルに入れた
環境
Ubuntu 14.04
MeCab 0.996
CRF++ 0.58
Cabocha 0.69
前提
MeCabはnlp100の前段階で入れていた
IPAのutf-8の辞書を(参考:MeCab公式)入れていた
コマンドオプションで mecab -d /var/lib/mecab/dic/ipadic-utf8 として(.zshrcでaliasかけて)済ませていた.
インストール
CRF++のインストール $ tar xvfz CRF++-0.58.tar.gz $ cd CRF++-0.58 $ ./configure $ make $ sudo make install
Cabochaのインストール $ ./configure --with-charset=UTF8 --enable-utf8-only $ make $ sudo make install
エラった $ cabocha morph.cpp(187) [charset() == decode_charset(dinfo->charset)] Incompatible charset : MeCab charset is euc-jp, Your charset is UTF8
最初,Cabochaがeuc-jpになっているのかと思ってそっち方面で調べていた.
よく見たらMeCabやん!
ということで,
.zshrcでの暫定措置をやめる alias mecab='mecab -d /var/lib/mecab/dic/ipadic-utf8'
/etc/mecabrcを編集 # dicdir = /var/lib/mecab/dic/debian dicdir = /var/lib/mecab/dic/ipadic-utf8
.cabocharcを作成 (参考) mecabrc = /etc/mecabrc
これで無事に,MeCab,Cabocha共に動くようになった.
教訓
エラーは流し読みしない
「ただしい」と打てば「ただしイケメンに限る」と変換候補が表示される、グーグルならではのIME「Google日本語入力」。ビジネスモデルは? ATOKやMS IMEなどの競合をどう考えているのか? どんな構造になっているのか? 気になる狙いと仕組みを聞いた。
N gramをしたいんだ!
そのためにCabochaで形態素解析しよーって話。だから使い方を覚えるためのコードを書いたよ!
PythonでCaboChaを使う(Win)
Mecabをインストールする(UTF-8)
CaboChaをインストールする(UTF-8)
CaboChaのバイナリを落とす
Pythonディレクトリでpython setup.py installを実行する。エラーが出たときは必要に応じてファイルを書き換える。
CaboChaのパスを通す
brewを使ってmacにcabochaを入れる