public class TextSimilarity extends Object
| 构造器和说明 |
|---|
TextSimilarity() |
| 限定符和类型 | 方法和说明 |
|---|---|
static String |
longestCommonSubstring(String strA,
String strB)
最长公共子串,采用动态规划算法。
|
static double |
similar(String strA,
String strB)
利用莱文斯坦距离(Levenshtein distance)算法计算相似度,两个都是空串相似度为1,被认为是相同的串
比较方法为: 只比较两个字符串字母、数字、汉字部分,其他符号去除 计算出两个字符串最大子串,除以最长的字符串,结果即为相似度 |
static String |
similar(String strA,
String strB,
int scale)
利用莱文斯坦距离(Levenshtein distance)算法计算相似度百分比
|
public static double similar(String strA, String strB)
strA - 字符串1strB - 字符串2public static String similar(String strA, String strB, int scale)
strA - 字符串1strB - 字符串2scale - 保留小数Copyright © 2022. All rights reserved.