import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.UnsupportedEncodingException; public class ChineseCharEncodingList{ private static final int MIN_INDEX = 19968; private static final int MAX_INDEX = 40869; private static final String CR = "\r\n"; private static final String TAB = "\t"; public void execute(String fileName) throws IOException{ File f = new File(fileName); FileWriter fw = new FileWriter(f); fw.write("字符"+TAB+"Unicode十进制"+TAB+"Unicode十六进制"+TAB+TAB+"GBK十进制"+TAB+"GBK十六进制"+CR); fw.write("=================================================================================="+CR); int GBKCode; for(int i=MIN_INDEX;i<=MAX_INDEX;i++){ GBKCode = getGBKCode(i); fw.write((char)i+TAB+i+TAB+TAB+Integer.toHexString(i)+TAB+TAB+TAB+GBKCode+TAB+TAB+Integer.toHexString(GBKCode)+CR); } fw.flush(); System.out.println("Done!"); } private int getGBKCode(int unicodeCode) throws UnsupportedEncodingException{ char c = (char) unicodeCode; byte[] bytes = (c+"").getBytes("GBK"); return ((bytes[0]&255)<<8) + (bytes[1]&255); } public static void main(String[] args) throws Exception{ new ChineseCharEncodingList().execute("汉字编码一览表.txt"); } }
相关推荐
Unicode和GBK编码转换表,GSM中文字库开发的好工具 以前的不能下载现在重新上传一个
unicode-GBK编码对照表,支持24068个字转换,这个表格适合运用各个平台,小程序,c语言等。
在网上找资料很少有汉字直接转GBK编码格式,一般都是汉字转Unicode编码,这套是将汉字先转换成Unicode编码,在通过参照表得出汉字的GBK编码数据。虽然是一个js文件,但是加以修改可以用于很多平台上如:小程序,...
unicode-gbk 编码对照表
字符unicode-GBK编码对照表,可直接导入做为数组查表 可应用与js微信小程序内
汉字的Uncode、GBK、区位码的对照表
gbk+unicode+汉字编码对照表
unicode,gbk编码相互转换C程序,附转换码表
c语言利用编码转换表实现gbk与unicode互转
unicode和GBK-BIG5编码对应表,個人辛苦整理,很有參考價值
使用windows进行unicode编码和GBK编码之间的转换的示例程序
gbk unicode 汉字编码对照表 一份xls文件包含: 汉字的unicode 十进制 十六进制 以及对应的gbk的十进制、十六进制
Unicode汉字编码表,包含几乎完整的汉字编码,PDF格式。资源分想给0分的,可是没这个选项,只好选择最低的2分。
unicode与gbk双向转换编码表,可以存放到flahs或外部flash中,以及对应的.h文件,可以编译到代码中
c/c++采用编码转换表实现gbk与unicode互转,文件内含有两个编码大矩阵, 采用unicode小端模式,程序简单易懂
每个汉字有两个字节组成,其对应两张十六进制编码,一种GBK形式,一种unicode形式
这是我整理了一星期,记过了好多测试、修改得出的结果,相信可以帮助在编写Unicode对应GBK编码的正则表达式的程序员一些帮助!
unicode汉字和拼音对照表,按照: 汉字 编码 拼音声标 拼音声调(声调在字母后)声调在拼音后 纯拼音 的格式排列。一共是20902个汉字编码范围是 U4e00 ~ U9fa5.