2025/12/25 15:31
理化学研究所 革新知能統合研究センター(RIKEN AIP)圧縮情報処理チームの西本 崇晃 研究員、田部井 靖生 チームディレクターによる研究論文が、データ圧縮分野の主要な国際会議「Data Compression Conference (DCC) 2026」に採択されました。
概要
本研究では、ゲノム配列や文書の編集履歴といった、同じパターンが繰り返し現れる「大規模で反復構造を持つ文字列データ」を対象とした新しいデータ構造「動的 r-index」を開発しました。これまでの技術では、データを圧縮した状態での検索と、内容の更新(データの挿入や削除)を両立させることは困難でした。本手法の導入により、高度に圧縮された状態を維持したまま、データの追加や削除を伴う効率的な運用が可能となります。
研究の意義
- 大規模データの利活用:
文書履歴や生物学的配列など、日々増大・更新される大規模な反復データに対して、省メモリかつ高速な検索手段を提供します。 - 低リソース環境への対応:
データの保持に必要なメモリ量を抑制できるため、計算資源が限られた環境やエッジデバイス上での検索や照合を含むデータ処理への応用が期待されます。
今後の展望
本技術は、プライバシー保護や低遅延が求められるエッジコンピューティング環境におけるデータ処理や、継続的に蓄積される大規模バイオデータの管理などへの貢献を目指します。
論文情報
- 国際会議名: Data Compression Conference (DCC) 2026
- 論文タイトル: Dynamic r-index: An Updatable Self-Index in LCP-bounded Time
- 著者: Takaaki Nishimoto, Yasuo Tabei

