统计文本中字符或词组的出现频率,支持自定义N-gram长度和字符类型
请输入文本并配置选项以开始分析
当您需要分析文本中特定字符或词组的出现规律时,手动统计既耗时又容易出错。本工具通过计算N-gram(连续字符序列)的出现次数,帮助您快速掌握文本特征。1-gram表示单字符频率,2-gram表示双字符组合频率,以此类推。结果可用于密码分析、语言模式研究或文本特征提取。
问:如何查看某个特定字符的频率?
答:设置为1-gram模式,在结果列表中查找对应字符。
问:分析结果包含哪些信息?
答:输出为字符序列与出现次数的对应关系,例如"a: 15"表示字符a出现了15次。可通过总字符数计算百分比频率。
超长文本可能导致浏览器响应变慢;N-gram长度越大结果越稀疏;非ASCII字符(如中文)会按单个字符处理。
对于密码分析,建议先尝试1-gram和2-gram;文本特征提取可尝试3-5 gram。示例输入"hello"的2-gram结果:"he:1", "el:1", "ll:1", "lo:1"。