JISC 日本工業標準調査会 > JISC-データベース 規格票を無料で閲覧できる。ただしPDFはスキャンした画像で画質は粗く、解説も付属していない。さらに2008年3月27日からダウンロードしたものは表示できないように小細工された。 > JIS X 0201 JIS X 0202 JIS X 0208 JIS X 0212 JIS X 0213 JIS X 0221 JIS作業計画の公開及びJISCへの意見陳述について これから制定または改正されるJISの原案 人名用漢字に対するJIS漢字コード表の対応状況の公表について 同等の資料が経済産業省のサイトでも公開されている。→人名用漢字に対するJIS漢字コード表の対応状況の公表について
日本規格協会 規格総合検索 規格票のオンライン販売。表からわざわざテキストデータを削除するといういやがらせ(じゃなきゃ何なんだ?)がされている。 たとえば JIS X 0213:2000/AMENDMENT 1:2004 に含まれる表は完全にアウトライン化されてテキスト情報が消えているが、ISO-IRに登録されているPDFに含まれる引用部分にはしっかりとテキストデータが存在する。なんで金払ってまで写経まがいの苦行を強いられなきゃなりませんか? そんなに転写ミスによる実装の誤りで混乱が拡大していくのがうれしいですか? JIS正誤票のお知らせ > JIS X 0208:1997(14.05) JIS X 0213<追補1>:2004(16.04) JIS最新発行 | 情報技術標準化研究センター (INSTAC) > 公開レビュー 移転後のページには古いページにあったリンクが必ずしも含まれていないので残しておく 公開レビュー > JIS X 0213 改正原案の公開レビュー 素案は削除済み > 漢字集合1面の符号表 | JIS文字コード改訂の考え方公開レビュー 資料は削除済み | 結果 これも削除済み 報告書の公開 公開レビューに同じ 報告書の公開 平成13年度 符号化文字集合(新JCS)調査研究委員会 成果報告書 上記の削除された素案から参照されている 平成14年度 符号化文字集合(新JCS)調査研究委員会の公開情報 平成13年度 符号化文字集合(新JCS)調査研究委員会の公開情報 人名用漢字の文字符号に関する規格検討報告会2005年1月版
法務省 > 法務省の紹介 > 民事局 > 戸籍統一文字情報 住基統一文字とは違うものらしい。ああ縦割り行政 審議会情報 人名用漢字部会 第1回会議 第2回会議 第3回会議 第4回会議 人名用漢字の範囲の見直し(拡大)に関する意見募集 人名用漢字の範囲の見直し(拡大)についての意見募集結果について 第5回会議 第6回会議 第7回会議 答申(人名用漢字の範囲の見直し(拡大)に関する意見) 法制審議会 開催予定 パブリックコメント 子の名に使える漢字
人名用漢字の変遷 テキストデータ(字体が正しく再現されるとは限らない)。JIS X 0208に「正しい字体が含まれない」文字に関しては代替テキスト付きの画像になっている。
電子政府の総合窓口 > 法令データ提供システム > 戸籍法施行規則 ニュースで不備を指摘されて表の部分が画像になった。
人名用漢字許容字体 81年の時点ですでに認められていた字体のみ許容字体表で引き続き認められた。
青空文庫 JIS X 0208と0213規格票の包摂関連項目 新JIS漢字で包摂の扱いが変わる文字 Shift_JISX0213エンコーディング。当然Windows Vistaでも正しく表示されない。 漢字表一覧 当用漢字表 官報のスキャン画像付き 当用漢字字体表 官報のスキャン画像付き 校閲君 JISで新旧分離している文字のチェック JISX0213包摂規準適用除外104字と常用漢字追加95字について 新字の底本でも当用漢字になく常用漢字で追加されたものには旧字が使われている場合がある。
新・旧字対照表 舊字體變換アプレット 電子版工具箱使用上の注意 イワマン日記 正字→略字變換CGI 新旧字体表 【ゐゑ】舊字、舊假名遣ひで話すスレッド 三箇目 テンプレに有用なリンク集多数 以下の漢字を使ひ分けられて、初めて正字使ひと言へる。 {万|萬}は? 新字⇔正字變換表
misima 旧仮名遣い・旧字変換支援プログラム (DTIミラー)
おことわり 本プログラムは Unicode UTF-8 コードを『今昔文字鏡』の文字番号に変換する機能を有しているが,ここで公開している Web 版ではライセンスの関係で利用できないようになっている.
文字コード関連の作成資料集 小形克宏の「文字の海、ビットの舟」―― 文字コードが私たちに問いかけるもの “情報化時代”に追いつけるか? 審議が進む「新常用漢字表(仮)」 小形さん。
★iモ沢くん _____ / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ | |。 | |オレ、 (| (二) |。 | < Unicode苦手なんだ… |____|。 | \____________ . (___) ∧__厂 ̄ ̄ ̄| || ,く| o |__| | ||〃 | o || | " | o ,〃 | └i^iー―(⌒) ┘ | | | | | | | | l二二l l二二l ____ 、ミ川川川彡 /:::::::::::::::::::::::::""'''-ミ 彡 //, -‐―、:::::::::::::::::::::三 ギ そ 三 ___ 巛/ \::::::::::::::::三. ャ れ 三 _-=三三三ミミ、.//! l、:::::::::::::三 グ は 三 ==三= ̄ 《|ll|ニヽ l∠三,,`\\::三 で 三 / |||"''》 ''"└┴‐` `ヽ三 言 ひ 三 ! | / 三 っ ょ 三 |‐-、:::、∠三"` | ヽ= U 三. て っ 三 |"''》 ''"└┴` | ゝ―- 三 る と 三 | / ヽ "" ,. 三 の し 三 | ヽ= 、 U lヽ、___,,,...-‐''" 三 か て 三 . | ゝ―-'′ | |::::::::::::_,,,...-‐'"三 !? 三 ヽ "" ,. | | ̄ ̄ ̄ 彡 ミ ヽ、___,,,...-‐''" ,,..-'''~ 彡川川川ミ 厂| 厂‐'''~ 〇 | ̄\| /
★米英シスターズ
A 互 し! _ -── ‐- 、 , -─-、 -‐─_ノ 互
R 換 // ̄> ´  ̄  ̄ `ヽ Y , ´ ) 換 え
I 漢 L_ / / ヽ 漢 |
B 字 / ' ' i 字 マ
ま が / / く !? ジ
で 許 l ,ィ/! / /l/!,l /厶,
だ さ i ,.lrH‐|'| /‐!-Lハ_ l /-!'|/l /`'メ、_iヽ
よ れ l | |_|_|_|/| / /__!__ |/!トi i/-- 、 レ!/ / ,-- レ、⌒Y⌒ヽ
ね る _ゝ|/'/⌒ヽ ヽト、|/ '/ ̄`ヾ 、ヽト、N'/⌒ヾ ,イ ̄`ヾ,ノ!
l の 「 l ′ 「1 /てヽ′| | | 「L! ' i'ひ} リ
は ヽ | ヽ__U, 、ヽ シノ ノ! ! |ヽ_、ソ, ヾシ _ノ _ノ
-┐ ,√ !  ̄ リ l !  ̄  ̄ 7/
レ'⌒ヽ/ ! | 〈 _人__人ノ_ i く //!
人_,、ノL_,iノ! /! ヽ r─‐- 、 「 L_ヽ r─‐- 、 u ノ/
/ / lト、 \ ヽ, -‐┤ ノ キ 了\ ヽ, -‐┤ //
ハ キ { / ヽ,ト、ヽ/!`hノ ) モ |/! 「ヽ, `ー /) _ ‐'
ハ ャ ヽ/ r-、‐' // / |-‐ く | > / / `'//-‐、 /
ハ ハ > /\\// / /ヽ_ ! イ ( / / // / `ァ-‐ '
ハ ハ / /! ヽ レ'/ ノ > ' ∠ -‐  ̄ノヽ /
{ i l ! / フ / -‐ / ̄/〉 〈 \ /!
日本は韓国(の互換漢字)にひどいことをしたよね (´・ω・`)
日本が7文字もの互換漢字領域を韓国から強制的に略奪した悪逆非道ぶりに比べたら、韓国がハングル大移動でBMPのたった1万1千程度を消費して非互換変更したり、中国や台湾が非常に短期間でわずか4万程度の漢字を追加して品質に懸念を呼んだり、北朝鮮がハングルを「より合理的な配列」に並べ替えることを要求したり将軍様専用ハングルの追加を要求したり、韓国が高麗大蔵経からほんの数万の漢字(大多数が異体字)追加を要求したりUNCとして1万ぽっちの漢字追加を要求したりする程度のことは誤差の範囲にも入りませんよね。ぼくたちわたしたちはみなこの事実を受け止め、漢字統合の唯一の被害国として悲惨な文字コード戦争を二度と起こさないように誓わなければならないと思います(棒読み)。
面接官「特技は文字鏡とありますが?」 学生 「はい。文字鏡です。」 面接官「文字鏡とは何のことですか?」 学生 「フォントです。」 面接官「え、フォント?」 学生 「はい。フォントです。超漢字に大ダメージを与えます。」 面接官「・・・で、その文字鏡のJIS化は常用漢字を改訂するうえで何のメリットがあるとお考えですか?」 学生 「はい。鬼畜米英が襲って来ても守れます。」 面接官「いや、我が国には襲ってくるような輩はいません。それに他国に武力行使するのは憲法違反ですよね。」 学生 「でも、Unicodeにも勝てますよ。」 面接官「いや、勝つとかそういう問題じゃなくてですね・・・」 学生 「文字図形が15万以上収録されているんですよ。」 面接官「ふざけないでください。それに15万って何ですか。だいたい・・・」 学生 「15万字です。グリフとも書きます。包摂というのは・・・」 面接官「聞いてません。帰って下さい。」 学生 「あれあれ?怒らせていいんですか?使いますよ。インデックスフォント。」 面接官「いいですよ。使って下さい。インデックスフォントとやらを。それで満足したら帰って下さい。」 学生 「運がよかったな。今日は金が足りないみたいだ。」 面接官「帰れよ。」
よく考えたらAAじゃないけど(・ε・)キニシナイ!!
規格票を読む前に言っておくッ!
おれは今JIS C 6228-1975の規格票をほんのちょっぴりだが体験した
い…いや…体験したというよりはまったく理解を超えていたのだが……
,. -‐'''''""¨¨¨ヽ
(.___,,,... -ァァフ| あ…ありのまま 今 起こった事を話すぜ!
|i i| }! }} //|
|l、{ j} /,,ィ//| 『おれはJIS C 6220(当時)ローマ字を使っていたと
i|:!ヾ、_ノ/ u {:}//ヘ 思ったらいつのまにかスウェーデン名前文字を使っていた』
|リ u' } ,ノ _,!V,ハ |
/´fト、_{ル{,ィ'eラ , タ人 な… 何を言ってるのか わからねーと思うが
/' ヾ|宀| {´,)⌒`/ |<ヽトiゝ おれも何をされたのかわからなかった…
,゙ / )ヽ iLレ u' | | ヾlトハ〉
|/_/ ハ !ニ⊇ '/:} V:::::ヽ 頭がどうにかなりそうだった…
// 二二二7'T'' /u' __ /:::::::/`ヽ
/'´r ー---ァ‐゙T´ '"´ /::::/-‐ \ WTERMのマニュアル間違いだとかfjで叩かれただとか
/ // 广¨´ /' /:::::/´ ̄`ヽ ⌒ヽ そんなチャチなもんじゃあ 断じてねえ
ノ ' / ノ:::::`ー-、___/:::::// ヽ }
_/`丶 /:::::::::::::::::::::::::: ̄`ー-{:::... イ もっと恐ろしいフライング掲載の片鱗を味わったぜ…
昔安岡先生のところに貼った奴
★やる夫がJIS漢字を改正するようです ____ / \ / _ノ ヽ、_ \ / o゚((●)) ((●))゚o \ 改正に反対の意見がいろいろ来たお… | (__人__) | \ ` ⌒´ / ____ / \ / _ノ ヽ、_ \ / o゚⌒ ⌒゚o \ でも対案の中身はバラバラだったお… | (__人__) | \ ` ⌒´ / ____ /⌒ ⌒\ /( ●) (●)\ /::::::⌒(__人__)⌒::::: \ だから原案通り行くお! | |r┬-| | \ `ー'´ /
何がすごいかって解説の7ページあたりに本当にそういう趣旨のことを書いているところ(さすがにAAは使ってないけど)。
例示字形変更 2004JISの変更をAJ1-5で表現したもの
JIS X 02XX の研究 JIS規格の著作権について。規格票は削除済み。JISCのサイトで見ましょう。
拡張する文字コード標準化と実装 次期Windowsは印刷標準字体に対応 Typography.EastAsianExpertForms Typography.EastAsianLanguage Windows Presentation Foundationでは、OpenTypeの日本語字形に関係するfeatureを指定できるようになった。XAMLからも利用可能。Win32ではUniscribeのversion 1.600以降でOpenTypeテーブルを利用可能。
アイヌ語用のカタカナ文字の入力についての注意事項 JIS X 0213の合成用半濁点など
Windows 9x を JIS X 0213 対応にする Windows NT を JIS X 0213 対応にする Windowsで第3・4水準漢字を使うための方法。サイトは閉鎖されたがNLSパッチは新漢字則で入手可能
JIS-UCS 変換表 声調記号はJISとUCSの間で互換性がないという話など
JIS X 0212-1990 と JIS X 0213:2000 正しく表示するにはJIS X 0212/0213のレパートリとJIS X 0202の符号拡張法に対応したブラウザが必要
MAPPINGS X 0213-UCSの非公式マッピング(JIS X 0213:2000に公式マッピングは存在しない。JIS X 0213:2004で定義された)および各種非公式マッピングの違い
Unicode 3.2 対応の「jisx0213code-csv.txt」について JIS X 0213の文字のうち302文字は補助漢字面に割り当てられ、25文字は合成で表すことになった。
JIS X 0213の特徴と、Emacs上での実装 JIS X 0213:2000の規格票では、互換漢字に提案するはずだった2-85-84が紛れ込んでいるため、BMPにないとして追加提案された漢字は303字ということになっている。
2002年の野望 2面の文字のうちUCSになかったものが282文字、JIS X 0212になかったものが(上記の282文字を含む)733文字
Unicode正規形、正規化とは UCSでは合成によってしか表せないJIS X 0213の25文字
ISO/IEC JTC/1 SC/2 WG/2 N2312 UCSにおける声調記号の合成に関する文書
文字 リンク集。大漢和辞典のダッシュ付き文字番号のe漢字と文字鏡番号の対応表など 2000年7月25日頃 JIS X 0213の文字の写像のされ方がヘンという話
字体史研究 Missionary Linguisticsに移転 漢字字体規範DB 豊島正之の個人研究のページ JIS漢字関係での発表済の文章
euc.JP (伊藤隆幸のホームページから移転) 文字コードの話 ISO 2022の説明など 新旧JIS漢字相違点一覧(改訂版) ECMA登録済文字集合名称一覧
numa's diary:補助漢字と日本語 EUC - livedoor Blog(ブログ) UI-OSF日本語環境実装規約 「日本語EUCの定義」が含まれる 旧 opengroup.or.jp にあった OSF/JVC 関連ファイルの再公開 日本語ロケール関連ファイル
文字・コードに関する覚え書き 東アジアの文字集合の概要: 中国語 GB12345の字数はバージョン1.6~1.9のcjk.infがソース? 東アジアの文字集合の概要: 日本語 東アジアの文字集合概要: 韓国語 GB2312-80 一般符号名称, および UCS BMP との関係 Win98 Font Extension
移転先 文字・コードに関する覚え書き 東アジアの文字集合の概要: 中国語 東アジアの文字集合の概要: 日本語 東アジアの文字集合概要: 韓国語 GB2312-80 一般符号名称, および UCS BMP との関係 Word98/Win98 で MS明朝に追加された文字
- intlfonts 1.2のjiskan16
大幅に略字化されてしまっている漢字があります。例えば「濾」や「齟」がJIS X 0213で追加された略字の形になっています。これはJIS X 0208 に適合しませんし、(後略)
ポカーン。ホントに規格票読んでるの? 「3.3.3 受信装置」の適合性に関する規定とか。JIS X 0213用のフォントとして使うなら確かに区別できないと適合しないが、少なくとも「JIS X 0208 に適合しません」は明らかに誤り。
SIL ViewGlyph - Font Viewing Program TrueTypeフォントの中身をグリフIDで覗けるツール。UCSで符号が割り当てられていないPresentation formなどもすべて表示できる。
Windows の中の JIS 外漢字 JIS X 0212にも0213にも含まれていないIBM拡張漢字
ビブロス外字 記号外字1800V2 ビブロス外字版 和文フォント大図鑑 [ダイナコムウェア/ビブロス外字一覧表] KJIS/Plus/学参外字一覧
SourceForge.jp: Project Info - skf - simple kanji filter KEIS/JEF→JIS、KEIS拡張→Unicode 3.2の変換テーブルを含む。
株式会社イワタ IWATAFONT イワタU-PRESSとは… X0213の文字数がだいぶ怪しいが… 製品情報 イワタU-PRESSver2の紹介
OpenTypeフォント関連資料 | フォント製品 | 株式会社モリサワ U-PRESSフォントとPr6/Pr6NフォントのCIDの違いなど
Windows View Vol.18 - ■ TrueType協議会からの意見聴取について - ◆日本語拡張フォント名称のガイドライン(案)
字形が変わったら既存の集合には手を付けず変更後のグリフに新たなCIDが付与されることになってる。実際にはAdobe Japan1-4以降、Adobe Japan1-0に相当する領域の漢字は突如JIS90の規格票字形を表すことになったりしてるけど。
Adobe-Japan1-6文字コレクションに対応する日本語OpenTypeフォントについて Windows Vista上のJIS2004基準のフォントについて Adobeによる公式情報
Glyph Access Protocol Mac OSで、エンコード対象外グリフ(Unicodeで独立した符号を振られていないグリフ)にアクセスする方法
Macintosh用のフォントで商売しているフォントメーカーが出すWindows用のTrueTypeフォントは、AJ1相当の字形を外字として実装していることが多いようである(たとえばモトヤシーダEX。もっとも内部のグリフIDはAJ1とはぜんぜん違う)。WindowsでCID指定や字体切り換えに対応したアプリケーションがほとんどない(Adobe InDesignくらい?)ためか。TrueType OpenではすでにGSUBが定義されているが(縦書きで使うから当然か)、肝心のWindowsが対応してくれないことにはどうにもならない。Uniscribeで有効になっているfeatureをVariation Selectorに使えるはずだが。
Koichi Yasuoka (Japanese Version) 本・論文・雑文 Adobe-Japan1の漢字(部首画数順) Unicodeの異体字表(Variants table for Unicode) 日本における最新文字コード事情 Character Tables by Koichi Yasuoka Unicode-JIS/Unicode-GB/Unicode-CNS/Unicode-大漢和 Ext.B対応中 (CJK Compatibility Ideograph Supplementが未対応の模様) 戸籍統一文字からOTFを作る
Font technical notes 最新のCMapはなぜかここではなく下記Oreillyのサイトにて配布されている Adobe CJK Character Collections and CMaps for CID-Keyed Fonts Adobe-Japan1-6 Adobe-GB1-4 Adobe-GB1-1でGB12345の繁体字2,180字を追加 Adobe-CNS1-4 Adobe-Korea1-2 Adobe-Japan2-0 [224301]小塚フォントのアップデートにおけるデータ受け渡しの注意点
Adobe - Font and Type Technology Center トップページ以外古いページを残したまま移転するという技にやられた Font technical notes Adobe-Japan1-6 2008-02-15に全面改定。例によって前版から黙って差し替えたグリフがある模様(参照: FeZn/Bookmark : AdobeJapan1-6の文字列を追跡してみたりする気分。)。 Adobe-GB1-5 GB 18030-2005に対応、イ文字を追加 Adobe-CNS1-5 HKSCS-2004に対応 JIS2004基準のOpenTypeフォントをビルドする方法 この資料を見る限りAdobe Japan1-5NやAdobe Japan1-6Nは俗称という結論で問題なさそう。しかしAdobe自身が使うなよ… Unicode Variation Sequences in OpenType cmap format 14はまだ正式化していない OpenType 1.5仕様
大日本スクリーンの公式サイト > SCREEN|千都フォント|特別企画 > ヒラギノPro漢字グリフ一覧 Adobe Japan1-5までの漢字グリフの内訳も
Index of /english_examples/nutshell/cjkv/adobe AJ16とJIS X 0212/0213の対応表など
国家标准化管理委员会 强标全文阅读 強制規格のPDFを無料で閲覧できる。GB 2312、GB/T 12345、GB 18030-2000、GB 18030-2005など。ただしAdobe Reader 8以降とFileOpen Plug-inをインストールする必要あり 标准查询 こちらは有償だが規格の前文のみ無料で読める。GB/T 7589-1987など。
工业标准咨询网 Yet another 規格検索 GB12052-89
#5706 (Upgrade gb18030-2000 to gb18030-2005) m-acute以外のマッピングは変わってないはずだが…(つまりUnicode 4.1で追加された符号位置を使うには4バイト符号を使うしかない)。
教育部语言文字应用研究所(国家语委普通话与文字应用培训测试中心) 语言文字规范标准库 簡化字総表 現代漢語通用字表 GB13000.1-93 GB2312-80 その他色々な規格のJPEGイメージ
CJK Kanji Database for Library Cataloger 簡化字総表を編集してUCSとの対応を加えたもの
参考資料 CJK Unified Ideographs Extension B PreDIS R1 For ISO/IEC DIS 10646-2:2000 漢字正形
アジア漢字圏の文字改革 (1964年の)簡化字総表の概要説明あり
AntennaHouse GBフォント・ソリューション・サービス GB2312/GBK/GB18030に関する解説
Ken Lunde cjk.inf 95年12月版 繁体字を使うべき(だがGB/T 12345-90ではそうなっていない)22字のコードポイント(これ以降の版では削除) 95年6月29日版 これ以降の版ではGB/T 12345-90で入れ替えられた区点位置が1文字追加されているが、Unihanの対応表には未反映 The World of Character Sets & Encodings JIS X 0212と0213で2,743の漢字が共通、3,058の漢字が0212のみ、952の漢字が0213のみ、少なくとも32の微細な字形差があるそうな Adobe Technical Note #5078: The Adobe-Japan1-6 Character Collection 全面改訂前の版のコピー
MicrosoftのGB18030サポート GB18030のNLSやExtension A対応フォント
IEのエンコードメニューにGB18030が現れるかどうかは、HKLM\SYSTEM\CurrentControlSet\Control\Nlsの下にCP54936の定義があるかどうかで決まるらしい。メニューの文字列をどこから拾ってきてるのかは謎のままだが。
韓国の人名用漢字表 日本とは逆で略字(新字体)が許容字体になってるのね
韓国文字コード専門委員会関連文書(Korea JTC1/SC2) KS X 1001:2002(草案?)の解説を含んだ全文などがある
Code2000 UnBatang フォントにGSUBテーブルが必要。OGulimはCJK領域に裏フォント方式で各種表現形が定義されているだけで、GSUBテーブルはないが、表現形を(漢字との衝突を避けるために)PUAに移してGSUBテーブルを追加するためのパッチが有志によって公開されている。
ほら貝:サロン 独裁国家では将軍様だけが専用の文字コードをもらえ、資本主義国家では駄々をこねて金を払えば誰でも自分の名前の漢字に専用のコードをもらえる(理論上は)。とうてい北朝鮮のことを笑えないと思うのだが。
課題 33466 KPS 9566-2003とUnicodeの変換表。
CNS 11643 字碼査詢&下載 CNS査詢 CNSコードポイントで文字を検索。ここで検索できるのは漢字のみ。 中文碼介紹 BIG-5碼介紹 ISO 10646 漢字庫
| 面番号 | CNS査詢 (2008-05) | 規格票 (2007) | 規格票 (1992) | 規格票 (1986) |
|---|---|---|---|---|
| 1 | 5401 | 5401 | 5401 | 5401 |
| 2 | 7650 | 7650 | 7650 | 7650 |
| 3 | 6395 | 6276 | 6148 | |
| 4 | 7298 | 7298 | 7298 | |
| 5 | 8603 | 8603 | 8603 | |
| 6 | 6388 | 6388 | 6388 | |
| 7 | 6539 | 6539 | 6539 | |
| 8 | 8836 | |||
| 9 | 1935 | |||
| 10 | 8836 | 8836 | ||
| 11 | 7472 | 3698 | ||
| 12 | 5418 | 3672 | ||
| 13 | 4743 | 4726 | ||
| 14 | 5473 | 5473 | ||
| 15 | 6831 | 6831 |
CNS査詢で検索できる字のすべてが標準化されているわけではないらしい。
經濟部標準檢驗局 CNSの検索ができる。いつの間にか2007年版が出てたけどCNS 11643-2004というのは存在していた形跡がない。さりげなく規格票のJPEG画像を閲覧もできる
中文資訊及資通術語標準網站 CNS 11643:2007の規格票から参照されてるのにリンク切れだったことがあるので、whoisで調べたIPアドレス版のURLも貼っておく→中文資訊及資通術語標準網站 中文資訊標準相關資料
教育部異体字字典 CNS11643に収録されている異体字の典拠が調べられる
中文資訊交換碼 CCCII <-> Unicodeの対応が疑わしい部分をファイルにしたものなど
台湾漢字のページ メーカーによる台湾の各種漢字コードなど
義守大學檔案伺服器 各種ファイルのアーカイブ
Big5 Variants in Mozilla: Mozilla 系列與 Big5 中文字碼 各種Big5の変種とUnicodeのマッピング Bug 310299より
紅眠亭 櫻花捜尋 Googleでも文字コードをUTF-8にするとBig5の仮名を検索できる Mozillaによるデータ破壊の問題はBug 9686の修正で解消した Big5とUnicode BIG5.TXTの謎マッピングの正体はIBMの変種であるというデマの発信源。 紅眠の愛の秘密日記
葉平的 Big5 網頁 Big5-2003草案の変換表など Big5-2003 文字コード関連のCNSのスキャンやBig5-2003の対応表など。やっぱりCNS11643はまだ改訂されていなかったらしい
IBM Code Pages IBM版Big5やらシフトJISやらの文字表のPDFあり。 IBM Globalization - ICU - Using ICU - Source Code Repository 変換表。仮名文字はETen互換であり、IBMのBig5がBIG5.TXTのソースであるという事実はない。BIG5.TXTマッピングなのはsolaris/java/glibcと名の付いた変換表。
Microsoft Character Code Conversion Routines For HKSCS-2004 Big5-HKSCS→Unicode 4.1、Unicode(Big5-HKSCSの外字にPUA使用)→Unicode 4.1の変換ルーチン
しめすへんの示とネは書体の違い U+795Eのしめすへんが「ネ」に変わったのは互換漢字と区別するためでしょうなあ。
MicrosoftのHKSCSサポート コードページ950のNLSが入れ替えられて、HKSCS対応になる。HKSCSでは倚天拡充字をまったく同じ位置に置いているので、結果として倚天の仮名も表示可能になる。JIS X 0213サポートは作ってくれないのに。
Opera/Mozillaはどちらも独自に変換テーブルを持っていてシステムの変換テーブルの影響は受けないが、エンコードとして「繁体字中国語(Big5-HKSCS)」をサポートしているのでそれを選べばとりあえず倚天の仮名が正しく表示できる。charset=Big5のページでいちいち選びなおさなくてはならないのは不便だが。Opera 9.64/Firefox 3.0.7ではBig5の変換表が改善されて、倚天拡張対応になっていた。
Unicode補完計畫 JIS X 0213 NLSと同様の発想で、Windows CP950の仮名を(PUAではなく)UCS本来の仮名に割り当てようという計画。NLSファイルを置き換えてWindowsのBig5エンコーディングで倚天の仮名文字を使用可能にするツール。MingLiUに含まれるひらがな・カタカナなども使えるようになる。またUnicode→Big5では日本漢字を繁体字にマップする多対一対応をサポートしているらしい。インストーラが繁体字中国語の非Unicodeアプリなので日本語環境だとインストールが大変…。
櫻花輸入法 Big5フォント用の外字ファイル。倚天のひらがな・カタカナを含む。手動でインストールするには、外字エディタでシステムの繁体字中国語フォントにリンクさせるのだが、日本語環境だと外字エディタが日本語フォントしか選ばせてくれないから手作業でリンクする必要がある。本家サイト
| ファイル名 | フォント名 | (英語) | 入手元 | FreeBSD ports |
|---|---|---|---|---|
| bsmi00lp | 文鼎PL細上海宋 | (AR PL Mingti2L Big5) | 文鼎科技(Arphic) | arphicttf |
| bkai00mp | 文鼎PL中楷 | (AR PL KaitiM Big5) | ||
| bkai08mu | 文鼎標準楷體 | (StdKai-Medium) |
「日本語」や「English」を選ぶとリンク切れしているので注意。四書体をGPL類似のライセンスで提供。繁体字中国語と簡体字中国語のUnicodeフォントが二書体ずつ。この他に教育部に無償提供(Googleキャッシュ/WayBack)している文鼎標準楷體がある。タイムスタンプが1998-01-14のBig5エンコーディングフォントと、1999-04-21のUnicodeフォントがある。
Google.comで「標準楷體」を検索すると出てこないページがGoogle台灣で検索すると出てくる。たぶん簡体字の統合検索機能のため。
免費軟體で文鼎標準楷體が入手できる。國語會/國字標準字體公告にもTrueTypeフォントあり。PC用はUnicodeエンコーディング/Linux用はBig5エンコーディング。
簡体字と繁体字のフォントを四書体ずつ無償提供。Unicodeエンコーディング。
第一水準のみ含む試用版を無償提供。Big5エンコーディング。
HKSCS: Download Area Reference Font(参考宋體)を無償提供。ISO 10646版とBig5版がある。 Common Chinese Language Interface: Download Area さまざまなHKSCS関係の資料やツール
十書体を無償提供。Big5エンコーディング。Linuxのパッケージにもなっている。
Internet ExplorerでMS細明體(MingLiU)を無償利用できる。
Unicode Home Page Code Charts (PDF Version) Unihan Database UCSコードポイントから文字の画像や情報を得る Unihan 3.1 Grid Index UNIDATA Enumerated Versions UTS #37: Ideographic Variation Database Ideograph Variation Selector and Variation Collection Identifier 古いドラフト PRI 98: Combined registration of the Adobe-Japan1 collection and of sequences in that collection Adobe-Japan1のすべての漢字グリフがUnicodeのプレーンテキストで表現可能になる予定 PRI 108: Combined registration of the Adobe-Japan1 collection and of sequences in that collection 仕切り直し Ideographic Variation Database 正式版
ISO/IEC JTC 1/SC 2 Document Register SC2登録文書の検索。FPDAMまでは公開されている(FDAMは非公開) Meetings 会議の一覧、議題及び議決事項へのリンク Programme of Work 作業計画。無償公開されている者にはリンクあり WG2 - ISO/IEC 10646 - UCS 審議過程の多数の文書あり。BMPへの漢字の追加はchartを見ても分からないので注意 ISO/IEC JTC1/SC2/WG3 - 7 and 8 bit coded character sets International Register of Coded Character Sets ISO 2022で使える文字集合の登録簿(番号順/複数バイト図形文字集合) Freely Available Standards ISO/IEC 10646:2003、/Amd.1:2005、/Amd.2:2006、/Amd.3:2008が無償公開されている。 今後の改訂も順次追加されていく予定。ISO/IEC JTC 1 Document Register Ranges JTC1N5001以降 Old JTC 1 Documents ISO/IEC JTC 1/SC 2 Document Register
Ecma International > Ecma Standards 一部のISO/IECの規格と同等のものが無償で入手できる
International Telecommunication Union (国際電気通信連合) Free access for all to ITU-T standards 2007年からITU-T勧告はすべて無償ダウンロードできるらしい。 How to use the ITU Electronic Bookshop 2001年からITU-R勧告は年3本まで、ITU-D勧告もすべて無償ダウンロード可能であるらしい。
cjkxref.fix UCS→JEFのマッピングが載っている
情報処理学会試行標準 > 符号化文字基本集合 (IPSJ-TS 0005) IICoreのもとになったもの。 文字図形識別情報 (IPSJ-TS 0002) > 文字図形閲覧ソフトウェア 符号化文字基本集合 - 日本コア漢字 (IPSJ-TS 0007) 大規模文字集合の異体字構造表現 (IPSJ-TS 0008) 文字図形間の構造的距離 — 定義とその算出法 (IPSJ-TS 0010)
IRG REPORTS SuperCJKはCJK統合漢字+Ext.A+Ext.Bを康煕字典順に並べて番号を振ったもの。全部足したより10文字多いのでそれだけではないようだが。 N807 IBMによる0213<->UCSの変換表。Latest Versions of CJK ISO/IEC 10646規格票のCJK統合漢字部 IRG N1132/IRG N1104 CJK統合漢字のバグ報告 Ideographic Variation Sequences-Implementation Details このためにformat 14の'cmap' subtableを追加するらしい Twenty-one kanji to be considered for unification PRI108で外された字形差の大きい異体字の統合はまだあきらめていないようだ
JIS非漢字-Unicodeのベンダによるマップの違い 日本語のUnicodeベンダ依存文字表 シフトJISからUnicodeへの変換テーブルの相違 従来の文字コードとUnicodeの対応に関する諸問題 JIS記号の UCS BMP へのマッピングの問題および MS漢字とシフトJISの違い [JavaHouse-Brewers:14445] JIS漢字とUCSの文字の対応について 既存の日本語文字コードと Unicode の間のマッピングルール XML日本語プロファイル Windows 2000上でのUTF-8のページの作り方 末尾で変換表の違いに触れている
符号化文字基本集合 (BUCS) UCSのサブセットを作る提案。UCSにはIICoreとして反映された。
漢字データベース計画 昔は「文字鏡データベース計画」という名前で文字鏡番号とUCS等の対応表を整備したりしていたが例によって(ry CVS サーバ/kanji-database/kanji-database/data JIS-UCS/CNS-UCS/GB-UCS/UCS-大漢和の対応表 Unicode 3.1の包摂規準を検証する 既存のマッピングを変えるわけにはいかないので訳のわからない状態になっている
統合漢字のメリットを説明するのに「grep 毛沢東」というのが用いられるそうだが、繁体字だと「毛澤東」簡体字だと「毛泽东」だから実は全然「grep 毛沢東」なんてできない。anti-UnicoderがUnicodeの中途半端なUnifyへの皮肉を込めて捏造した例なのか?
kGB1のみでkGB0でないものが2,202字、88区以降に追加されてかつkGB0になかったものが41字。Unihan 3.2ではkIRG_GSourceがGB1をソースとするものは、92区~93区に150字が追加されて2,352字になっている。これはUnihan 2.0にはない(というかkIRG_*シリーズ自体ないのだが)。150字の内訳はUnihanのヘッダによれば香港文字58字と韓国の吏読文字92字ということになっているのだが、実際のデータでは92区に59字、93区に91字となっていて数が合わない。93区の3箇所に不自然な歯抜けがあるのはUnifyのせい? 吏読文字94文字はGB 12052-89の71~72区から持ってきたそうな。
Very old fj.kanji discussion 13/622 ESC 2/8 4/8という誤った指示シーケンスの元凶 76/622 半角カナを指示のエスケープシーケンスでも使わないことにした理由らしきもの 269/622 ここにも 273/622 こことか 279/622 こことか324/622 78JIS/83JISの違い 339/622 PC-9801の漢字コードはJIPS 419/622 ASCIIやEBCDICの歴史 433/622 449/622 内部コードであるCP932をJISに適合してないから変えろと言う○○もたまにいるようだが 454/622 JEFは83JISで変更された文字をすべて別区点で含むらしい 612/622 JIS X 0202-1986の解説には94集合が終端バイト06/10(ギリシャ語)まで、94^n集合が04/02(JIS X 0208:1983)まで書いてあったらしい。
べんぜんエリア Adobe-Japan1-4 & APGS実践情報 諸橋大漢和辞典 初版縮写版→修訂版間の差 その他の版の間の差も判明している限り網羅している eKanjiの大漢和との字形差について
UCS-GB-大漢和検字番号等変換表 UCS-GB-CNS-JIS-KS-大漢和検字番号(DKW) Ext.A/B未対応
康熙字典網上版 康熙字典全ページのJPEG画像閲覧や全文検索ができる。
CHISE プロジェクト XEmacs CHISEのデータベースからさまざまなコード間の対応などの属性が得られる 漢字構造情報データベース IDS 形式 写像表 JIS-UCS/CNS-UCS/Big5-UCSなど CHISE IDS 漢字検索
fonts.jp KAGEサーバ仕様 拡張IDSで合成した字形を取得できる。コードはUCSだが地域別の字形も指定可能 KAGE/DB 漢字分解器 CHISEプロジェクトの漢字構造情報データベースを利用 GlyphWiki 花園フォント
京都大學21世紀COE 東アジア世界の人文情報學研究教育據點 成果物 Adobe-Japan1の漢字(部首画数順) 他にもおもしろそうな資料多数
GT書体(東大明朝、GT明朝) GT新書体の実装 ゆたかな文字文化を創りあげるために 東京大学多国語処理研究会 GT明朝(東大明朝)とトロンを批判する GTコード検索システム 大漢和番号との対応は新撰漢字総覧から得られる。XEmacs/CHISEのデータベースにも載っているが1割程度しかない模様
オープンテキスト OPT-DOWNLOAD GT書体フォント・GT番号→Unicode(Ext.A/B未対応)/SJISの変換表。こちらのほうがGT書体のバージョンが新しい ttf-gtfonts Unicode compliant? GT2000フォント一覧表
山口先生は、飾りをできるだけ取った、鉛筆書きのような線だけの字体を望まれていたのですが、
当用漢字字体表みたいなの? でも、そのつもりは全くなかったのに筆押さえを取り払われてしまったりしたそうだから世の中そんなに甘くないと思う。GTは筆押さえの有無も区別してるけど。ていうか今のGTの書体でさえ異字体を示した例かと思ったとか、「画数を正確に表すために」「瞥」の上下の「小」を切り離したら字形が違うと言われたとかいう始末で、日本人の漢字運用能力の低下は壊滅的なところまで来てると思う。
Tフォント (旧称T書体フォント) 坂村・越塚研究室 - Multilingual Processing 東京大学坂村研究室が36万文字からなる世界最大の漢字フォントセットを無料公開 漢字フォントの内訳が記載されている 39万文字の文字フォントセット「Tフォント」を参考出品します 2年の間に甲骨文字セットが追加された模様
TRON文字収録センター TRONコードが割り当てられた文字の画像を検索可能 TRONコードの概要 大漢和は修訂二版 レパートリー一覧 超漢字で扱える文字の内訳 第1編 BTRON3 仕様書に対する制限・補足 BTRON4で規定された文字など Data(Sumiya Lab) 超漢字12:3 大漢和部分対応一覧
超漢字検索 その他の部首検索: シータ ハイパー検索 サンルイ超漢字検索サイト CHISE IDS 漢字検索
JIS X0213の168文字の例示字形を変更,10文字については新規追加 JIS2004の字形変更をTRONで入力。TAD? なので読めない。
e漢字 全フォントの一括ダウンロードはできなくなったらしい e漢字 Unicode(J欄)/康煕字典/大漢和(修訂一版)の24ドット字形データ。Windows用のGIF変換ツールが付属。 daikanwa.txt 諸橋大漢和の字数 コードチェック 大漢和コード/康煕コード/Unicodeから文字の画像を得る play eKanji 別の検索ゲートウェイ 諸橋大漢和コード 字形字姿 INDEX 京大康煕コード 字形字姿 INDEX JISX0221 字形字姿 INDEX
今昔文字鏡 先頭の約5万字は大漢和の修訂二版と同様ということになっているが、実際には明らかに違う字も存在する。具体的にどの番号がどう違うか説明するとJASRAC文字鏡研究会から文字鏡番号の使用料を請求されかねないので書けないが。
文字鏡番号はエーアイ・ネットが著作権を主張して囲い込み戦略をとっているため、情報交換用としては何の役にも立たない(例: 1 2 3 4 5 6 7 8 9 10)。一言で言うと無償版では他の人からもらった文字鏡フォントを使っている文書を表示する以外のことはほとんど何もできない。さらに15万字版のフォントはダウンロード提供されたことがない(と思ってたが2007年11月から短い期間だけ公開されていたらしい)。文字鏡番号による情報交換ができない以上、エーアイ・ネットに貢ぐことで単に作字する手間を省ける巨大な外字集以上のどんなメリットが得られるのかさっぱり分からん。あ、金を貢いだ同士なら情報交換できるんですね。いやー素晴らしいビジネスモデル。電子政府でも採用が決まったみたいですしエーアイ・ネットは未来永劫安泰ですね。おめでとうございます。(2010-06)金払えというページだけ残してすべて削除。素晴らしすぎて物も言えない。どうせ金を払うならone time feeかつ意味不明なライセンスに縛られない分16万字版でも買った方がマシだと思うが。
GIFリンクサービス 文字鏡番号から文字鏡サーバで提供されている文字の画像を得る Konjaku Moji Kyou 大漢和辞典のダッシュ付き文字番号及び欠番。明らかにここに書かれている以外の欠番も存在する 文字鏡と超漢字大漢和枠で大きく異なる字形 (3月14日) ダウンロードサービスの中止について
____________ ヾミ || || || || || || || ,l,,l,,l 川〃彡| V~~''-山┴''''""~ ヾニニ彡| 再開する・・・・・・! / 二ー―''二 ヾニニ┤ 再開するが・・・ <'-.,  ̄ ̄ _,,,..-‐、 〉ニニ| 今回 まだ いつから1年間か その開始時点の /"''-ニ,‐l l`__ニ-‐'''""` /ニ二| 指定まではしていない | ===、! `=====、 l =lべ=| . | `ー゚‐'/ `ー‐゚―' l.=lへ|~| そのことを |`ー‐/ `ー―― H<,〉|=| どうか諸君らも | / 、 l|__ノー| 思い出していただきたい . | /`ー ~ ′ \ .|ヾ.ニ|ヽ |l 下王l王l王l王lヲ| | ヾ_,| \ つまり・・・・ . | ≡ | `l \__ 我々がその気になれば !、 _,,..-'′ /l | ~''' 再構築完了は ‐''" ̄| `iー-..,,,_,,,,,....-‐'''" / | | 10年後 20年後から1年間ということも -―| |\ / | | 可能だろう・・・・・・・・・・ということ・・・・! | | \ / | |
CD-Rの実費頒布 Vista対応を口実にMojikyo Character Mapの配布は中止した模様。多年に渉る膨大な開発費を投じたことによって生成されたきわめて価値のある業務上の秘密情報をそうやすやすと使わせられるわけないから当然のことだよね。
今昔文字鏡 紀伊國屋書店がやっている営利事業の方 文字鏡WEB 2008年3月で終了。営利企業が不採算事業から撤退するのはきわめて当たり前のことだしサービスを利用する側も当然そういうリスクは織り込み済みに決まってますから全く何の問題もありませんね。 indexfont:インデックスフォント|検索 類似字形画面の説明に出てくる「微細なデザイン差」の識別とやらはなんだかすごそうに見えるが、ここで区別されているのはそもそも文字鏡が「筆画を正しく表すため」とか何とか称して発明した独自の字形と一般的な書体の字形。そういうのが3万字くらいあったから収録文字数がいきなり3万字増えたわけで、つまり自ら増やした異体字を収録して「世界最大」と自画自賛してる。○ねばいいのに。まあTRONコードも超漢字2→超漢字3になっったとき字数が減ったと思われないようにGT書体と大漢和を別々に収録したりしてるけど。
インデックスフォント研究会 インデックスフォント番号とは要するにエーアイ・ネット様に金を貢いで使わせていただいてる文字鏡番号のことだそうなので、一連番号が振られたところで部外者にはちっともうれしくない。
ISO/IEC 10036 Registration Authority for Font-Related Objects ISO/IEC 10036 specification 仕様書 ISO/IEC 10036 Font-Related Object (FRO) Registry (旧URL) 登録されているグリフの画像。いきなり画像が1つも見えなくなってるし。指さして笑うぞしまいには。文字鏡のグリフをタダで一覧表示したり文字鏡番号以外のマトモな方法で検索したりできるものは徹底的に葬りたいんでしょうな。表向きはサーバの過負荷の問題と言うことになっているようですが(N297、N320)、この「過負荷」が解消することはたぶん永久にないのでしょう。(2010-06)信じがたいことに復活してた。
ISO/IEC JTC 1/SC34/WG2 N376
In February 2010, the temporal glyph server http://glyphsv.ipc.hiroshima-u.ac.jp/ was officially registered as the server providing the services at 10036ra.org (DNS, Web, etc). The domain "10036ra.og" would be kept for 3 years at least, but next renewal could be reconsidered.
クールなURIって知ってますか? すでに1回引越してるのに。わざわざ大学名を含んだURIにまた引っ越すとかアホですか? しかも 10036ra.org の登録を放棄したら100%確実に間違いなくSEO業者に速攻で奪取されるわけで、最悪の選択肢と言っていいと思う。N338 The change will not affect the URI of the registration service.
嘘つき。
The Registration Authority agreed to provide the registration without free under special condition. Now required condition has been discussed.
"without free"は"without fee"のtypoかな? IVDに対抗ですねわかります。
すでに今昔文字鏡はISO/IEC 10036も見放して文字図形識別番号のJIS化だとか言ってますし。こんな風にすぐ放り投げては次の金儲けに移るから安心して使えやしないのです。 Font Museum いつの間にかなかったことになってる。予算がつかなかったんでしょうな。 JIS X 4165 (ドラフト) JISの対応規格 ISO/IEC JTC1/SC34/WG2
Embedding Glyph Identifiers in XML Documents (EGIX) XML文書にグリフIDを埋め込むマークアップ。タグの内容がFallbackになる(HTMLのobject要素等と同じ発想)。XMLではEGIXを使わなくても記法(Notation)で参照できる(外部解析対象外実体として宣言して実体参照で参照する)そうだが。記法を使った場合のメリットはタグと違って属性値に使えることか。 JIS X 4166 (ドラフト) JISの対応規格。ただしフォールバックに複数文字を含めることができなくなっている点がEGIXと異なる。さすが、ISO-2022-JPの仕様がIETFとJISで規定されてしかもそれぞれが微妙に異なることに懸念を示していた村田真先生だけあって、素晴らしい判断ですね!
文字文化協會 次から次へとよくもまあ訳のわからん怪しげな目くらまし団体をでっち上げるもんだ。
出席者 (snip) ・古家時雄(特定非営利活動法人 文字文化協會 副理事長)・板倉和治(インデックスフォント研究会)
がすべてを物語ってます。インデックスフォント番号だの文字図形番号だのと「文字鏡番号」という言葉を懸命に避けているのも意図的に違いない。
C5: 我が社では、15万字版の文字鏡の検索機能を使用してお客様に文字を確認してもらい、その番号を取得して処理をするようになり、お客様に喜ばれている。
C6: 今出ている15万字の番号は、現在は一企業のものだが、JIS化されれば、 国民全体で使える番号になる。
だまされてはいけません。最近のJIS規格票の冒頭には高確率で
この規格は、著作権法で保護対象となっている著作物である。
この規格の一部が、特許権、出願公開後の特許出願、実用新案権又は出願公開後の実用新案登録出願に抵触する可能性があることに注意を喚起する。経済産業大臣及び日本工業標準調査会は、このような特許権、出願公開後の特許出願、実用新案権又は出願公開後の実用新案登録出願に係る確認について、責任はもたない。
とか力いっぱい書かれています。つまりJIS化で文字鏡番号にお墨付きを与えて国民全体に使わせてエーアイ・ネットの商売にもっと手を貸せと言うことですね? (Y/y)
TRONへの搭載を拒否するという大目標(…)がある以上、エーアイ・ネットが文字鏡番号の利用を自由化することは天地がひっくり返ってもあり得ないのです。てゆーか多年に渉る膨大な開発費を投じたことによって生成されたきわめて価値のある業務上の秘密情報ですからねー。
で、相変わらず国際規格は無視して、つーかせっかく国際規格にしたISO/IEC 10036は捨ててまで(なんか表向きもっともらしい理由をでっち上げてはいるけど要するにグリフの登録に金が掛かるばかりでちっとも儲からなかったんでしょうね)車輪の再発明をして(これで何度目?)ガラパゴス化の道を突き進むと。
しかし、フォント仕様(OpenType等)の制限により240のバリエーションは使用できず、実質的には1~2桁少なくなる。(フォントが一つの面につき65k字までしか表現できないので、仮にBMPの27,000字の漢字がIVSCを使うとすると65,000÷27,000≒2.4字となる)。
もうどこから突っ込んだらいいのやら。そりゃIVSは商売の邪魔だから好意的になれるはずもないでしょうし、IVDに文字鏡番号を登録するとそれは事実上Unicodeとの対応表として機能してしまう上に登録した番号は自由に使えることを強要されるから、何としてでもIVDに登録するという選択肢は存在しないことにしなければならないのでしょうけど、こんなあからさまな嘘までつきますかね。
株式会社エーアイ・ネット 今昔文字鏡UnicodeEdition試用版ダウンロード Unicodeに対応していないUnicodeEditionの試用できない試用版(詳しくは下記16万字版レビューのおまけ参照)
製品レビュー:今昔文字鏡単漢字16万字版 もちろん信じられるはずがありません。超漢字2の二の舞はまっぴらごめんです。仮にライセンス改訂が本当だとしてもあくまでエーアイ・ネットがライセンスする16万字版の話ですから、文字鏡研究会がライセンスする無償版に対する制限はそのままです。16万字版のユーザーが変換表やツールを自作するまでは問題ないかもしれませんが、それを16万字版ユーザーでない者の目にも届くところで頒布するなんて恐ろしくてできるはずがありません。
どうしても文字鏡番号を使いたいなら、他社のツールや野良ツールなどに期待せず今昔文字鏡を買うべきだし、不満があるならエーアイ・ネットに要望すべきなのです(たかだか3万円弱では話を聞いてもらえないかもしれませんが)。16万字版はExt.Bも含めたUnicodeの入出力ができますから、買っていれば少なくとも文字鏡から逃げ出すことはできます。実際に超漢字2で文字鏡面を使っていたユーザーは変換すらできずに立ち往生したわけですから、逃げ出すときのことまで検討しておくのは決して杞憂ではありません。
でも優待バージョンアップの申込期限も過ぎた2009年4月17日現在、今昔文字鏡単漢字16万字版を合法的に入手する手段はありませんね。エーアイ・ネットのページには「通常版を4月発売予定」とか書いてたはずなのにいつの間にかなくなってますし。まあその程度の不誠実さで今さら驚いたりはしませんけど。
ユーティリティ:今昔文字鏡番号ビューワ このユーティリティに関する声明
ですから許諾を申請すればたぶんすんなり通ることでしょう。
そんな簡単に通るなら誰もここまで嫌ったりしません。とまでは言いませんが、嫌わなかった人もいたでしょう。
たとえば、とあるツール(番号をアルゴリズム的に変換するだけのもの)を公開していた開発者は、公開継続のために以下の条件を突きつけられたそうです(で、公開をやめました)。
ちなみに文字鏡研究会はボランティア団体なので、配布を委託したツールが「人手不足」とか「ツール公開は仕事ではない」とかの理由でいつまでたっても公開されなかったりするのは日常茶飯事です。もちろん自前で配布しないという条件に同意しているので、自前で配布もできません。パーソナルメディア社も文字鏡研究会にBTRON形式の文字鏡フォントを納入したはずなのに、配布されることのないまま葬り去られてしまいました。
エーアイ・ネットと(おそらくもっと高額の)契約をすれば上記とは異なる条件で配布できるのかもしれませんが、超漢字の末路を知っていてなお契約したいと思う蛮勇の持ち主がいたら見てみたいものです。もっとも「JIS Z xxxx 文字図形識別番号(仮称)」が制定されたら、場合によっては(規格への準拠が入札条件に含まれているとかの理由で)契約を余儀なくされる羽目になりそうですが。他に許諾を与えられるものはいませんから、エーアイ・ネットは自ら受注できなくても受注した企業と言い値で契約できるわけです。それ以外のことも何でもやり放題ですね。
電子出版リンク集によると
1994年4月に開始した電子出版プロジェクト。消え行く知的財産をネットワーク上に残していくことを目的としている。「絶版のない世界」
ネットワークから消え行きました。しかも運営会社自体はまだ残ってるのに。
官報 最近一週間分のみ。httpsでもつながる。署名のないプラグインをインストールさせるならせめて積極的に活用すればいいのに。いつの間にかプラグインのダウンロードページにSSL版のページへのリンクが追加されていた。このリンクは新しいウィンドウで開く(官報のサイトがフレームを使っていると考えるとこれはきわめて重要)。
Microsoft AppLocale Utility システムロケールを変更して再起動しなくても海外の非Unicodeアプリケーションで文字化けしなくなる。
スタートメニューへの登録などは、他言語用にローカライズされたフォルダ名のせいでうまく行かない場合がある。
Code Pages Microsoftの変換テーブルの仕様。
http://suika.fam.cx/gate/cvs/perl/lib/Encode/Table/cp/ WindowsのNLSをテーブル化したもの
javascript:alert(escape('文字'))とアドレスバーに打ち込めばUnicodeの文字コードがわかる
日本語練習中 安岡孝一の新聞記事・テレビニュース yasuoka の日記 JIS X 0213メーリングリスト 文字符号化blog もじのなまえ Bottom Note 小川創生@檸檬の家 Mac OS Xの文字コード問題に関するメモ numa's diary PDF 千夜一夜 作業メモとか考えた事とか 明朝体・考 しろもじメモランダム M59の記録
Windowsの次期バージョンWindows Vista(TM)において日本語フォント環境を一新 JIS X 0213:2004 対応と新日本語フォント「メイリオ」について Mac OS Xの文字コード問題に関するメモ - Windows Vistaのjp90タグにおける「喩」の問題 Windows XP および Windows Server 2003 で JIS2004 対応フォントを使用する方法 Microsoft Windows Vista:Windows XP および Windows Server 2003 向けJIS2004 対応 MS ゴシック & MS 明朝フォントパッケージについて Windows Vista 向け JIS90 互換 MS ゴシック・明朝フォントパッケージについて
PAGE 2007 report AppleのLeopardにおける対応(の予想)
Ruby M17N UCSというのは固有名詞だと思うのでTRONコードのことをUCS Normalizationと言うのは微妙な感じ。TRON code normalizationならまあ何とか。しかしそうなるとISO/IEC 2022はISO/IEC 2375 registered CCS normalizationで、MIMEはIANA registered charset normalizationで、MuleはMule internal encoding normalizationだったりするのだろうか。CSIの代表のように言われているCitrus iconvだって64ビットの内部コードを使ったCitrus internal encoding normalizationとも考えられる。CSIDは一意ではなくエンコーディング依存らしいじゃあCSIとHoge normalizationの違いって何? CSIは文字列が単なるバイトの並びであるC言語では実現不可能で、常にencoding情報を付随させることのできるRubyのような言語が必要だってこと?
Mule-UCSに関するユニコード定義 「Mule-UCS自身は全くユニコードに依存していません」
もう見事なまでに日本発の実装ばかり。まあそもそも日本でしか必要とされていないし(海外で困ってる場合はふつうわざわざUnicodeと対立しないでUnicodeに追加提案したりUnicodeを補完する仕様として定めたりする)。それを馬鹿正直に言ってしまうと(SJIS/EUC/JIS7間の変換を効率化するためだけにUCS正規化強制をやめれとか)国際的に通らないから大風呂敷を広げざるを得ない→いつまで経っても目途が立たないのコンボ。
説文解字・龍龕手鏡・広韻・玉篇・集韻・篇海・康煕字典などの古字書の画像が見られる
GLOCOM NEWSLETTER Summer, 1996 特集 国境をこえる日本語の条件 戦前の漢字書き取りテストの採点がおもしろい
xdoc2txt PDFやWord文書からテキストを抽出できる
DSSSL規格対応表 DSSSLにはグリフを置き換える機能があるそうだが
文字と言語の実験室 リンク集
漢籍担当職員講習会 KPS 12052-89って何やねん。97年に-89が制定とか言う文書書いてて自分で少しも疑問に思わないのだろうか。
http://www.ietf.org/internet-drafts/ で始まるURIには現在有効なInternet Draftsのみが格納されている。期限切れのInternet Draftsは、URIの先頭を http://tools.ietf.org/id/ に書き換えれば参照できる。参照できないよりは全然マシだけどクールじゃない。後者には期限切れじゃないInternet Draftsも入っているようなので、最初から後者でURIを統一すればいいのかも。
出水書房 JIS 24ドットフォント(JIS X 9052)拡張版 for TrueType
Kandata 歴史的経緯はともかく、現在ではXANO明朝をリネームしただけのフォント
QANO明朝 JIS X 0213をいわゆる旧字体で実装したフォント
Win2000、XPでUnicode tableのないフォントをインストール可能に 上記のフォントはシフトJISの'cmap'テーブルしか持っていないため、Windows 2000/XPでは通常認識できない。それを認識可能にするツールだそうな。でもためしにインストールしてみたら文字コード表ではまともに表示できなかったものの、ワードパッドでは(JIS X 0208の範囲内の文字なら)ちゃんと表示できた。Windows XP SP1以降では標準で表示可能なように戻されたらしい。
HGX0213検索セット Ricoh Japan > 製品情報 > ソフトウェア製品 > フォント > 購入申し込み > フォント > HGX0213検索セット 符号化は裏フォント方式による独自エンコーディングで、他のフォント(Shift_JIS-2004/Shift_JISX0213またはUnicodeを採用)とは異なる。したがって利用には付属の検索ツールが必須 TrueTypeWorld ValueFontD2 外字サンプル
UX JIS0213明朝-R/UX J0213古典明朝-R/UCX J0213古典明朝-R それぞれXANO明朝/QANO明朝/癸羊明朝におおむね対応している。合成が必要な25文字は含まないので11,208文字
一般利用者向けIPAフォントのダウンロード JIS X 0213:2004対応。改変可能な開発者向けライセンスは2008年度中に用意される予定。
IPA Font License | Open Source Initiative Article 5.1の"IPA may publish revised and/or new versions of this License. In such an event, the Recipient may select either this Agreement or any subsequent version of the Agreement"って、突然何の履歴も残さず、バージョン番号も変えずライセンスを差し替える可能性に備えた条項だったんでしょうか。CCのバージョンアップ条項みたいなものだと思ってたんですけど。
IPAフォントが2009年4月中旬にもオープンソース・ライセンスへ,改変と再配布が自由に:ITpro 追記に「ドラフトを間違えて乗せていたので差し替えた」と書かれているのだが、そう判断した理由(たとえばURLに"draft"と含まれてるものを何で正式版と確信しているのか)とかそもそもIPAのサイト上からどうやってこれらのライセンス文を見つけたのかとかは一切不明。
しょうがないので自力で見つけてきた。license-review@opensource.org: Thread on: For Approval: IPA Font License v1.0 って何でライセンスを見ている側がこんなことしなくちゃならないの? IPAが自ら告知することだろ。Article 5.1で受領者はすべて突然の差し替えに同意しているはずだし万が一差し替え前のライセンスを添付して配布されていてもArticle 5.1を適用して新ライセンスで配布し直せば済む話だから告知の必要などありませんってか。でも日付すら変えてないのにどっちが新しいかなんてどうやって判断するの?
[ubuntu-jp] IPAフォントがオープンソースライセンスへ この件に関するIPAの対応は本当にひどい。このMLログでようやく経緯がわかった。報告した奴にだけこっそり連絡しないでちゃんと差し替えがあったことを告知しろ>IPA。 間違ったライセンスが公開されていた期間中にライセンス文を参照して言及してた奴はたくさんいるぞ。海外にまで。あとから読んだ奴が混乱するだろ。IPA自身が正式に告知しない限りは、やっぱり「何の理由もなく突然こっそり差し替えた」とみなすしかない。
問い合わせの件 - tabatee の日記 clarification - tabatee の日記 正直言って「どうせ偏屈ものがへそ曲げただけだろ」とか思ってた時期が私にもありました。いやほんとごめん。
IPA職員の私物PCからの情報流出事件、該当職員が停職3ヶ月の懲戒処分に 「何この処分。本当にあのIPAが?」とか思ってた時期が私にも(ry。今では「IPAだからね」ととてもよく納得できます。
Y.Oz Vox 手書き書体Y.OzFont。JIS X 0213以外にもいろいろな文字を収録。OpenTypeの字形切り替えに対応。
パブリフォント - DynaComware Corp.(ダイナコムウェア) 電子文庫パブリ パブリ双葉社電子書店[ツールのダウンロード] ||||| 祥伝社 Web Books ||||| - ツールのダウンロード 徳間web書店 --- ツールのダウンロード DFパブリフォント 無料ダウンロード可能。表外字がいわゆる正字(あるいは78JIS字形)で実装されている電子ブック用の書体。
秀英体TrueTypeフォント これも表外字をいわゆる正字で実装したフォント。
Fontcity4 印刷標準字体を本来の区点で実装したフォント Fontcity : 富士通ミドルウェア Fontcity4 字体比較一覧
FontAvenue外字パック 78JIS, 90JIS, 旧字体などを外字として実装
Adobe-Japan1-5について 印刷標準字体を字形切り替えでサポート。JIS X 0213:2000対応 ヒラギノOpenType基本6書体パック その実装例
QANO明朝 癸羊明朝 文字鏡契冲 漢字道楽 常用漢字もいわゆる旧字体で実装したフォント。QANO明朝はJIS X 0213、他はJIS X 0208の包摂規準に準拠
FontAvenueセレクト18書体パックの特長 78JIS(というかJIPS)字形を実装
16000字超の漢字と11000字超のハングルが入った軽量CJKフォント Droid Sans Fallback TrueTypeのcomposite glyph機能をフル活用してサイズを節約しているらしい。デジタル分合活字は現実の活字では不可能なグリフの重ね合わせなどができますからね。 Droid Sans Fallbackの日本語サポートが酷い ですよねー。フォントマニヤではないふつーの人が抱く感想。 Droid Sans Japanese Droid Sans Fallbackでは中国系だった漢字の書体を日本風に直したもの。
Asian and Central European font packs for Adobe ReaderAdobe Reader 7.0用のJapanese font packに含まれる「小塚明朝 Pro-VI R」はAdobe Japan1-6に対応している。
Microsoft Global IME CJKのフォントも付属
たあやんわあるど ほーむぺーじ (移転先/転送URL/tar-yan.world.coocan.jp) TCM Unicode(Firefoxでは表示できない)/電子書體(フォントのコーナー) (移転先) たあやんわあるど うぇぶろぐ TCM明朝(非JIS漢字)、TCM Unicode SIPなど。
M+ OUTLINE FONTS DFSG freeなゴシック体フォント。(2008-06)教育漢字完成!
JIS検索 JIS X 9051、JIS X 9052
Vietnamese Unicode FAQs HAN NOM A/B
海峰五笔・超大字符集・标准通用版・免费下载 Sun-Ext A/B
freedesktop.org - Software/CJKUnifonts オープンソースのCJKフォント。
efont さざなみフォントの開発・配布
Standards インドの国家規格IS 13194:1991
自作プログラム集 shiftjisエンコーディングのTrueTypeフォントをunicodeエンコーディングに変換するttfcnv_aなど。バイナリはBeOS用だがソース付き。コンソールプログラムでとくにBeの機能は利用していないのでわずかな手直しで他OSでもコンパイルできると思われる。
今まで誰も同じようなことを考えなかったのだろうかと思ってたらやはり車輪の再発明をしていたらしい。サロゲートや合成には未対応のようだし、(GSUB/mortはそのままでグリフを並べ替えるので)縦書き字形が正常に表示できなくなると思うが。
ttc→ttfやttf→ttcの変換を行うツールもある。
日本と中国の漢字使用状況の比較研究 小さな漢字にClearTypeが効いてるのはどうやってるんだろう。(2003/10/07)lang=ZH-TWでfont-size:10.5pt;font-family:serifを指定したらこうなった。MingLiUは10.5ptのサイズだとClearTypeが効くらしい(IEデフォルトのフォントサイズ「中」だとだめだった)。ていうか10ポイントや12ポイントでは効かないっていったい…。MS 明朝でも18pt程度でもう効くようになった。Windows 2000では48ptまで拡大しないとだめだったのに。
WindowsはフォントのフォーマットをDSIGの有無で判別する。もっともPostScriptアウトラインのOpenTypeフォントと違って変わるのはアイコンだけで、GDIなどからは相変わらずTrueType扱いのようだが。
OpenTypeフォントはグレースケールをサポートする。EBLCテーブルでbitDepthに1以外を指定すると埋め込みビットマップの階調指定になる。Appleの仕様ではあくまで白黒ビットマップとして扱われるようだが。
さらにOpenTypeフォントはサイズごとに異なるアウトラインもサポートするようだが。
OpenType specification OpenType仕様バージョン1.5/1.4
Macでグリフ置換を実現するにはAATのテーブル(morx)が必要。OpenTypeのテーブルだけでは、縦書きも、旧字体への置換もできない(ヒラギノにはAATのテーブルが含まれるため可能)。こんなんでOpenType対応とか言ってしまっていいんだろうか。当たり前だがInDesignならできる。
Text & Fonts Technote 10012(改)Mac OS 8.5 からのフォント環境 MacのTrueTypeフォントのビットマップ形式について
wTTC MacのttfをWindows用に変換するツールやMacのttfフォーマットの解説
Mac OS X: フォントのファイルフォーマット Mac OS XではWindowsのフォントフォーマットもMac OS 9以前のフォントスーツケースも使える。新しくデータフォークにフォントスーツケースの情報を格納したデータフォークフォントもある(Windowsのフォントフォーマットとは異なる)。
File Encodings and Fonts Mac OS XはCarbonではShift_JIS、CocoaではUnicodeのcmapを使う。
pm9t-sriw Ttmodify - TrueTypeフォントのテーブルを編集するツール / Mac font extracter - MacのTrueTypeフォントをWindows用に変換するツール
TrueType Viewer OpenType Layoutの適用をOSとは独立に行っている
Freeware Fonts FreeのOpenTypeフォントLegendum。
SIL Encore Fonts 多数のOpenTypeの機能を使ったフォント。
YNLC Fonts and Keyboards カナダのユーコン準州で使われている8ヶ国語をサポートする表示用のフォントと入力用のキーボードレイアウト。フォントはOpenTypeの機能を多数利用している。
SIL FieldWorks: Downloading and installing SIL FieldWorks SE (Standard Edition) 5.2にはWindows Vista SP1のものと同等(バージョン1.626.6001.18000)のUniscribeが含まれる。
Visual OpenType Layout Tool OpenTypeのテーブルを編集するMicrosoftのツール。Uniscribeのベータ版も入手できる。
Fonts for Bible with Cantillation Marks msvolt.exeへの直リンクとusp10.dllの詳細な抽出方法
Microsoft VOLT users community ていうかコミュニティのトップページがGoogle検索であっさり出てくるし
Microsoft Typography - Visual OpenType Layout Tool (VOLT) MSNグループの廃止によってダウンロードページが正式に公開された。multiplyには移行しなかった模様。この件1つとってもmultiplyへの移行がいかに無茶な話だったかわかろうというもの。
Download details: Volt 1.3 Windows Vista SP1/Windows Server 2008に付属のものと同等のバージョンのUniscribeが付属する。
Microsoft Font Validator TrueTypeフォントのフォーマットが不正でないかどうか調べるツール。MSNグループ廃止前の案内。 Microsoft Typography - Microsoft Font Validator MSNグループ廃止後はこちら。
Appleのフォントツール。AATのテーブルを作成したり検証したりできる。
武蔵システム フォントエディタTTEdit/OTEditなど
FontForge (旧称PfaEdit) Xで動くフォントエディタ。 FontForgeについて Mac OS X ユーザのための PfaEdit Windows版 fontforge 簡単 お手軽パッケージ
FontCreator シェアウェア。米国製のようだがUnicodeエンコーディングであればCJKのフォントも開ける。
ttf_edit グリフ編集能力はない
BabelPad 新しいUniscribeの入手方法やUniscribeのバグについて
Changing your Uniscribe version システムのUniscribeを置き換えるための手順について書かれた文書。SILのヘブライ語フォントパッケージに含まれる。
UNICODEから引くOpenTypeコード表 非漢字編
IE7では以下の問題は修正されており、日中混じりの文章でも問題なく表示できる。
以下はWindows 2000以降でのみ可能。Windows 95/98/MeにはFontLinkの機能はない。
いちばん簡単な方法は、日本語のフォントをMS UI Gothicにすること(参考)。MS UI GothicはFontLinkで他言語のフォントがリンクされているので表示できる。"HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\FontLink\SystemLink"に同様の設定を作成すればMS PGothicでも可能。
Windows XPではデフォルトでフォントがリンクされるので削除するだけでも一見よさそうだが、中国語のフォントが使われている部分で半角分の文字送りしかされず、文字が重なるので使い物にならない。
Mac用のMozillaはGecko 1.9でAATをサポートした。AATをサポートしているそうな。AATの機能を実装しろとか似たようなバグもなぜかオープンだが。今はCoreTextに移行した模様。
mozdev.org SIL Graphiteを組み込んだバージョンのMozilla。本家への統合計画もあったが中止された。
Windows上ではFirefox 3でcairo移行によりUniscribeを使うようになってOpenType Layoutをサポート。'locl'サポートなど積み残しもあるけど。Firefox 4から、Windows 7ではDirectWriteを使う予定。
LinuxではPangoを使用する計画が進行中。WONTFIXになってた。その代わりもっとモダンなHarfbuzzを使う計画らしい。
IVSをサポートするのはWindows 7/Microsoft Office 2010に付属のUniscribeからだが、プログラム側の改修も必要。
Windows Vistaに付属のUSP10.dllはバージョン1.626.6000.16386。OpenType Layoutタグをサポートするための新関数を含む。またIE7は何も考えなくてもExtension Bにある漢字を表示できる。
Windows XP SP2 RC1に付属のUSP10.dllはバージョン1.420.2600.2096。ちなみにSP1は1.408.2600.1020。
Windows 95/98/Me/NT 4.0以前はOSがサロゲートに対応していないが、Uniscribeを最新にすることで対応できる。サロゲートだけでなくUnicode 3.0のさまざまなComplex Scriptすべてに対応する場合、Uniscribe 1.407.0以降が必要らしい。ワードパッドはサロゲートをちゃんと一文字として扱うらしいし。IE6をインストールするとWindows 98/Me/NT4ではUniscribeは最新になる。Windows 2000では手動で更新する必要がある。
Uniscribe(USP10.dll)はWindows Installer(MSI) 1.1/2.0のインストーラにも含まれ、一緒にインストールされる。Windows 2000はMSI 1.1、MeはMSI 1.2、2000 SP3/XPはMSI 2.0を含む。
Windows Installer 2.0 (Win95/98/Me/NT4/2000) USP10.dll 1.0325.2180.1を含む
Windows Installer 1.1 (Win95/98/NT4) USP10.dll 1.0325.2145.1を含む
2007 Office systemsがインストールするUSP10.dllはバージョン1.626.5756.0。OpenType Layoutタグをサポートするための新関数を含む。
Windows 95にはもちろんUSP10.dllは付属しない。Win95日本語版では、どうあがいでもSMPの文字をBabelMapで正常に表示できなかった(「??」になる)。FE(極東版)だから?
Windows 98に付属のIEは4なのでUSP10.dllは付属しない。Windows Installer 2.0をインストールすると、SMPの文字がBabelMapで表示された(IEでは表示できない。おそらく5.5以上が必要)。
Windows 98 SEに付属のUSP10.dllはバージョン1.0175.0000.1。Uniscribeが古いためこのままではBabelPadやBabelMapでもSMPの文字を表示できない。IE 5.01~5.01 SP2をインストールしてもUSP10.dllのバージョンは変わらない。Windows Installer 1.1をインストールしたら1.0325.2145.1になって、SMPの文字がBabelMapで表示される(IEでは表示できない)。IE 5.5 SP1をインストールするとUSP10.dllのバージョンが1.0325.2180.1になって、SMPの文字がBabelMapで表示される。レジストリの設定をすればIEでも表示可能。Windows 98のメモ帳はUnicodeに対応していない。ワードパッドは対応しているがSMPの文字は全部「?」に変換されてしまってダメ。またUTF-8には対応していない。
Windows Meに付属のUSP10.dllはIE 5.5が標準でインストールされているのでバージョン1.325.2180.1。何もしなくてもSMPの文字がBabelMapで表示される。レジストリの設定をすればIEでも表示可能。
Windows NT 4.0にはUSP10.dllは付属しない。IE4をインストールしてもUSP10.dllはインストールされない(UniscribeはIE5からの機能だから当たり前だが)。IE 5.01をインストールするとUSP10.dll バージョン1.0175.0000.1が入るが、SMPの文字は表示できない。Windows Installer 1.1をインストールすると、バージョンが1.0325.2145.1になって、SMPの文字がBabelMapで表示される。またWindows 98とは異なり、IEは5.01のままでもレジストリを設定すればSMPの文字が表示可能になる。でもメモ帳ではだめ。Uniscribeを使う必要があるのかな。ちなみにNT4のメモ帳はUTF-8に対応していないし、ワードパッドはUnicodeに対応していない。
Windows 2000に付属のUSP10.dllはバージョン1.325.2180.1。フォントのインストールとレジストリの設定だけで、Internet Explorer 5.01でもBabelPadでも表示できた(対応を公式に明言してるのだから当然かも)。メモ帳で表示するには再起動が必要。ワードパッドではSMPに欧文フォントを割り当てられず表示できなかった。どちらもUnicodeにもUTF-8にも対応はしている。
TrueTypeフォントでもBMP超の文字をサポートできる。たとえばCode2001は、システムから(OpenTypeフォントではなく)TrueTypeフォントとして認識される。ただOpenTypeフォントと言った場合、通常はATMを入れるかWindows 2000以降でしか認識できないPostScriptアウトラインのフォントを指すようである。TrueTypeアウトラインのフォントは(アイコンがどうであれ)システムからは相変わらずTrueTypeフォントとして認識されている。
USP10.dll(Uniscribe)の使い方 Uniscribe Windows 2000の正式版リリース後に書き直されたもの
Windows 2000では、"HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\LanguagePack"の"SURROGATE"をREG_DWORD:0x00000002に設定してサロゲートを有効にする。Windows XP/Server 2003(の東アジア版)では初めから有効。Windows Vistaでは全言語版ではじめから有効。
"HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\International\Scripts\41"と"HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\International\Scripts\42"の"IEFixedFontName"と"IEPropFontName"にそれぞれ使いたいフォントの名前を記入する。41がPlane1(SMP)、42がPlane2(SIP)用の設定と思われる。
IEでは「ユーザー定義」エンコードを使わないとSMPの文字を表示できないようなことが妖精現実に書かれているが、41を設定すると「ユーザー定義」エンコードでなくても表示できる。MSDNの説明は"IME provider"、すなわち東アジア向けのものだからSIPについてしか説明していないのであろう。ではSMPでは41を使えばいいという説明がどこにあるのかは知らないが。というか41はLim Scriptのはずなのだが…。
文字参照でサロゲートが使えるかのようなデタラメ説明を掲示板で突っ込まれても無視してるし、PDFについてのデマはひどいし、妖精現実の記事はあまり信用しないほうがよさげ。
とか書いてたらいつの間にか修正されていたようだが、
Mozilla は実際にはサロゲートによる文字参照を解釈できるが、
それはバグです。Firefox 3/2.0.0.17で修正されました。ちなみにWindows Vista + Firefox 2ではメイリオにないPlane 2の文字が□のように化けてしまう。IE7は表示できるが、サロゲートによる文字参照も解釈してしまう。
下記のデモでは、該当箇所で両方ともサロゲートを使わないように変更した。
𤰞と直すべきところが歷になってる罠。いくら何でも適当すぎ。
uni_web01 Windows 2000/XP + Internet Explorer 6でExtension Bの漢字が表示可能(もちろんフォントは必要)。ここで紹介されているWindows 2000 Surrogate 更新 (簡体字中国語)は本来Surrogate対応IMEのセキュリティアップデートだが、導入すると上記のレジストリ設定が自動的になされる。
XPにはSurrogateFallbackという設定があるらしい(usp10.dllを覗くとこの文字列が出てくるのだがXP以外では有効にならないのだろうか)。
10進文字参照は表示できたけど16進文字参照はできないなあ…。数値の頭に余分な0が入ってると認識しなくなる模様。これが正しい振る舞いなのかどうかは不明。Firefox 3.6ではいつの間にか表示できるようになってた。いつの間に修正されたのか不明。IEは(IE9pp2でも)相変わらずダメ。
BabelPad BabelMap Windows 95/98/MeやWindows NT4でもサロゲートペアで表現された文字を表示できる。もっとも上述したように日本語版の95ではうまくいかなかった。Windows 2000以降だとOSには表示する能力がある(デフォルトで無効の場合もある)が、付属の「文字コード表」(charmap.exe)はWindows VistaですらBMP外の文字を表示できないという。
Extension Bの文字を表示するときの制限 ここで字形産生器が紹介されている。部分字形を組み合わせるだけならTrueTypeでもできなくはないが、CJKのストロークを認識するわけではなく単なる相似変換になるので使い物にならない。とか言ってたら実際にこの機能を使ったTrueTypeフォントが登場してしまった。なるほど、使いそうな幅や高さの種類分だけあらかじめ部品を用意しておけばいいわけか。