JAVA 统计字符串中中文,英文,数字,空格,特殊…
2019-06-14 08:03:27来源:博客园 阅读 ()
引言
可以根据各种字符在Unicode字符编码表中的区间来进行判断,如数字为'0'~'9'之间,英文字母为'a'~'z'或'A'~'Z'等,Java判断一个字符串是否有中文是利用Unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 但通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果。所以通过Character.UnicodeBlock来进行判断。代码如下:
package cn.csrc.base.count;
public class CountCharacter {
public static void main(String[] args) {
String str ="我爱你abcd123中国 #!";
CountCharacter countCharacter = new CountCharacter();
countCharacter.count(str);
}
/**中文字符 */
private int chCharacter = 0;
/**英文字符 */
private int enCharacter = 0;
/**空格 */
private int spaceCharacter = 0;
/**数字 */
private int numberCharacter = 0;
/**其他字符 */
private int otherCharacter = 0;
//记录中文字符
private StringBuilder sb1=new StringBuilder();
//记录英文字符
private StringBuilder sb2=new StringBuilder();
//记录数字
private StringBuilder sb3=new StringBuilder();
//记录特殊字符
private StringBuilder sb4=new StringBuilder();
/***
* 统计字符串中中文,英文,数字,空格等字符个数
* @param str 需要统计的字符串
*/
public void count(String str) {
if(str.equals("") || str==null){
System.out.println("字符串为空");
return;
}
for (int i = 0; i < str.length(); i++) {
char tmp = str.charAt(i);
if ((tmp >= 'A' && tmp <= 'Z') || (tmp >= 'a' && tmp <= 'z')) {
enCharacter ++;
sb2.append(tmp+" ");
} else if ((tmp >= '0') && (tmp <= '9')) {
numberCharacter ++;
sb3.append(tmp +" ");
} else if (tmp ==' ') {
spaceCharacter ++;
} else if (isChinese(tmp)) {
chCharacter ++;
sb1.append(tmp+" ");
} else {
otherCharacter ++;
sb4.append(tmp +" ");
}
}
System.out.println("字符串:" + str + " \r\n");
System.out.println("中文字符有:" + chCharacter +"个 ("+sb1.toString()+")");
System.out.println("英文字符有:" + enCharacter +"个 ("+sb2.toString()+")");
System.out.println("数字有:" + numberCharacter+"个 ("+sb3.toString()+")");
System.out.println("空格有:" + spaceCharacter+"个");
System.out.println("其他字符有:" + otherCharacter+"个 ("+sb4.toString()+")");
}
/***
* 判断字符是否为中文
* @param ch 需要判断的字符
* @return 中文返回true,非中文返回false
*/
private boolean isChinese(char ch) {
//获取此字符的UniCodeBlock
Character.UnicodeBlock ub = Character.UnicodeBlock.of(ch);
// GENERAL_PUNCTUATION 判断中文的“号
// CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号
if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
|| ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOG RAPHS_EXTENSION_B
|| ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS
|| ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {
System.out.println(ch + " 是中文");
//sb1.append(ch+" ");
return true;
}
return false;
}
}
结果如下:
原文链接:https://www.cnblogs.com/zhaosq/p/11014746.html
如有疑问请与原作者联系
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
上一篇:添加定时执行功能
下一篇:啊哈算法之纸牌游戏小猫钓鱼
- 国外程序员整理的Java资源大全(全部是干货) 2020-06-12
- 2020年深圳中国平安各部门Java中级面试真题合集(附答案) 2020-06-11
- 2020年java就业前景 2020-06-11
- 04.Java基础语法 2020-06-11
- Java--反射(框架设计的灵魂)案例 2020-06-11
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash