ぽんぽこ日記

プログラミング、読書、日々の生活

2010-09-18から1日間の記事一覧

アジア言語圏のPDFのテキスト抽出 3

フォント情報から文字コードを得る方法です。まず、Font情報はそのフォントを使用するページのResourceとして登録されているので、その情報を取り出します。 CGPDFPageRef page; // page ページオブジェクトを取得。。。 CGPDFDictionaryRef pageDict = CGPD…