安原誠 MakotoYASUHARA
所属
筑波大学大学院 システム情報工学研究科 コンピュータサイエンス専攻
知能情報生体工学研究室 自然言語処理グループ
(筑波大学 情報学群 情報科学類卒業)
研究
コンパクトかつ高速なNgram言語モデルデータ構造の検討
大量のデータから学習した言語モデルは統計的機械翻訳の性能を向上させることが分かっています。
しかし、学習データ量を増やすと同時にモデルサイズが大きくなり、データ構造を展開する際にサイズや速度の問題が生じます
そのため、大規模なデータ量から学習した言語モデルを小さくかつ高速に探索するデータ構造手法の研究をしています。
キーワード
統計的機械翻訳(SMT)・言語モデル・Ngram
トライ構造・DoubleArray・SuccinctDataStructure・LOUDS
可逆圧縮・最小完全ハッシュ法(MPH)・BloomFilter・BloomierFilter
連絡先
mail:youth[at]mibel.cs.tsukuba.ac.jp
twitter:@mac_oh_toe
リンク
研究室
知能情報生体工学研究室
自然言語処理グループ
学内組織
筑波大学
システム情報工学研究科
コンピュータサイエンス専攻
情報科学類
その他
筑波大学混声合唱団
つくば市
栃木県佐野市