【C#】字串相似度比較

  • 1647
  • 0
C#對字串相似度的nuget套件
 
 
最近看到一篇點部落的文章兩個字串的「相似度」
這篇文章講的是javascript的實作
我看到心想...那C#有沒有現有元件可以實作
我自己用nuget是看到兩個套件
F23.StringSimilarity
LevenshteinMinimumEditDistance
有興趣的可以自己找(相信可以找到更多,後者我只有裝但沒試驗)
StringSimilarity.NET有很多種演算方法的實作
大部分算法是產生兩個字串的差異字元數量
比如說
跟"3"這個字串的差異度,以下字串由小到大排列結果為:
13(1),00(2),134(2),22(2),16454743(7)
我本來想看這能否用來做到有點類似搜尋引擎那種相似度比對,我的目標也只是對table的某個字串欄位做相似度比對,但看來那沒那麼簡單
LevenshteinMinimumEditDistance看起來是只針對某種演算方法使用
github上沒甚麼教學與介紹,要了解用法得看單元測試的程式
而且會跟StringSimilarity.NET衝到
要選擇的話我建議選擇StringSimilarity.NET
就實用性來說,我想到的用途只有
1.猜數字的幾A幾B計算
2.如果是那種只有選擇題的考試,答案都組成字串,可以拿來算與正確答案差異多少