Skip to content

docs(roadmap): Phase 進捗の反映と新規 Phase 追記#249

Open
send wants to merge 1 commit into
mainfrom
docs/roadmap-progress-update
Open

docs(roadmap): Phase 進捗の反映と新規 Phase 追記#249
send wants to merge 1 commit into
mainfrom
docs/roadmap-progress-update

Conversation

@send

@send send commented Jun 22, 2026

Copy link
Copy Markdown
Owner

概要

docs/ime-research.md のロードマップ節を実装状況に合わせて更新。ドキュメントのみの変更(コード変更なし)。

変更内容

  • Phase 1 (Rewriter パイプライン) → ✅ 完了。実装済みの 5 rewriter (Numeric / Katakana / HiraganaVariant / PartialHiragana / KanjiVariant) + run_rewriters() を反映
  • Phase 2 (POS 文節分割 + structure_cost) → ✅ ほぼ完了。structure_cost のハード/ソフトフィルタ、group_segments()resegment()、per-segment penalties、length_variance を反映。残課題(segmenter.def 相当の分割点補正)を明記
  • Phase 2.5 (スニペット機能) → ✅ 新規追加。SnippetStore / VariableResolver
  • Phase 3 (辞書サブプロジェクト分離) → IT/業務辞書構築の動機・候補ソース・フォーマット・コスト推定方針を追記
  • Phase 4 (ニューラルリランキング) → karukan の Adaptive Strategy を参考に追加

テストプラン

  • ドキュメントのみの変更、ビルド・テスト影響なし

🤖 Generated with Claude Code

- Phase 1 (Rewriter): 実装済み 5 rewriter + run_rewriters() を反映 ✅
- Phase 2 (POS 文節分割 + structure_cost): 実装内容を反映、残課題明記 ✅
- Phase 2.5 (スニペット): SnippetStore / VariableResolver を新規追加 ✅
- Phase 3: IT/業務辞書構築の動機・方針を追記
- Phase 4: karukan Adaptive Strategy を参考に追加

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
Copilot AI review requested due to automatic review settings June 22, 2026 23:52

Copilot AI left a comment

Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Pull request overview

docs/ime-research.md のロードマップ節を、現状の実装状況(Phase 1/2/2.5 の到達点や Phase 3/4 の方針)に合わせて更新するドキュメント変更です。コード変更はなく、研究/設計メモとしての「今どこまでできていて次に何をするか」を読みやすく整理しています。

Changes:

  • Phase 1(Rewriter パイプライン)を実装済み前提で具体的な rewriter 群と実行フローまで明記
  • Phase 2(POS 文節分割 + structure_cost)を「ほぼ完了」として、実装済み要素と残課題を明確化
  • Phase 2.5(スニペット機能)を新規 Phase として追記し、関連コンポーネントを記載

💡 Add Copilot custom instructions for smarter, more guided reviews. Learn how to get started.

Comment thread docs/ime-research.md
Comment on lines +148 to +152
- NumericRewriter: ひらがな数字→漢数字/半角/全角 (最大 ~10^16)
- KatakanaRewriter: 全文カタカナ候補
- HiraganaVariantRewriter: 漢字セグメント→ひらがな置換
- PartialHiraganaRewriter: Top-5 パスの個別セグメント単位でひらがな置換
- KanjiVariantRewriter: ひらがなセグメント(2文字)→漢字代替案
Comment thread docs/ime-research.md
- HiraganaVariantRewriter: 漢字セグメント→ひらがな置換
- PartialHiraganaRewriter: Top-5 パスの個別セグメント単位でひらがな置換
- KanjiVariantRewriter: ひらがなセグメント(2文字)→漢字代替案
- run_rewriters() で順次実行、重複排除
Comment thread docs/ime-research.md
Comment on lines +161 to +165
- structure_cost: 遷移コスト集約 + ハードフィルタ + ソフトペナルティ (Mozc インスパイア)
- group_segments(): POS role ベースの形態素→句グループ化 (接尾辞/関数語マージ、接頭辞処理)
- resegment(): ラティスノードを使った代替分割案生成 (最大10パス)
- per-segment penalties: 非自立漢字、代名詞ボーナス、て形漢字、人名、単漢字内容語
- length_variance: 3セグメント以上のパスで不均等分割にペナルティ
Comment thread docs/ime-research.md
Comment on lines +169 to +170
- SnippetStore: HashMap ベース、prefix_search、TOML 設定
- VariableResolver: $varname / ${varname} 展開、未定義変数検証
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants