辞鏡
日本語関連のライブラリーを提供しています。
現在は主に、記号処理、文字列処理が中心です。
- suji
-
日本語の数字表記を実際の数値/漢数字に変換するライブラリです。
数値への変換は、漢数字 (五十六)、アラビア数字 (123.456)、漢数字の分数 (三割二分五厘) に対応しています。
入力文字列内で数値に変換できる部分文字列に対し、対応する文字列の start、end、変換された数値、を返却します。
数値に変換できる文字列が存在しない場合は空リストが返却されます。
合法的でない入力 (例: 5万六十六6) に対しても、合算 (50,072 = 50,000 + 60 + 6 + 6) を返却します。
漢数字への変換も同様に、対応する文字列の start, end, 変換された漢数字文字列、を返却します。
-
JavaScript /
Java /
Python
- romaji
-
日本語のひらがな/カタカナ表記をローマ字に変換するライブラリです。
IME のローマ字入力をベースにしていますが、ヘボン式、日本式、訓令式にも対応しています。
ローマ字表記候補を可能な限り多く返却することを目標にしています。
「ちゃ」はローマ字表記「cha」、「tya」、「chixya」、「tixya」、「chilya」、「tilya」と複数のローマ字表記に変換されます。
ローマ字に対応していない入力 (漢字等) は入力がそのまま返却されます。(例: お茶の水 → o茶no水)
-
JavaScript /
Java /
Python
Copyright © 2019- jikyo All Rights Reserved.