日本語版CodeLlama
2つ前の投稿でCode Llamaを使った簡単なWebアプリケーションをモノづくり塾のサーバーにデプロイした話を書きましたが、ELYZAさんが日本語で追加学習したモデルを公開したので簡単なアプリケーションをStreamlitで作って載せ替えました。 なかなか良い感じです。 例によってGPU非搭載のサーバーなのでLlamaCppを使ってCPUで動かしています。 塾の建設が終わってひと段落ついて予算に余裕があればこのサーバーにも16GB程度のメモリーを持つGPUを載せます。推論を実行するだけならそれくらいのものが載ればそこそこ使えるはずです。
View On WordPress














