c#字符相似度对比通用类

本类适用于比较2个字符的相似度,代码如下:

View Code
using System;
using System.Collections.Generic;
using System.Text;

public class StringCompute
{
    #region 私有变量
    /// <summary>
    /// 字符串1
    /// </summary>
    private char[] _ArrChar1;
    /// <summary>
    /// 字符串2
    /// </summary>
    private char[] _ArrChar2;
    /// <summary>
    /// 统计结果
    /// </summary>
    private Result _Result;
    /// <summary>
    /// 开始时间
    /// </summary>
    private DateTime _BeginTime;
    /// <summary>
    /// 结束时间
    /// </summary>
    private DateTime _EndTime;
    /// <summary>
    /// 计算次数
    /// </summary>
    private int _ComputeTimes;
    /// <summary>
    /// 算法矩阵
    /// </summary>
    private int[,] _Matrix;
    /// <summary>
    /// 矩阵列数
    /// </summary>
    private int _Column;
    /// <summary>
    /// 矩阵行数
    /// </summary>
    private int _Row;
    #endregion
    #region 属性
    public Result ComputeResult
    {
        get { return _Result; }
    }
    #endregion
    #region 构造函数
    public StringCompute(string str1, string str2)
    {
        this.StringComputeInit(str1, str2);
    }
    public StringCompute()
    {
    }
    #endregion
    #region 算法实现
    /// <summary>
    /// 初始化算法基本信息
    /// </summary>
    /// <param name="str1">字符串1</param>
    /// <param name="str2">字符串2</param>
    private void StringComputeInit(string str1, string str2)
    {
        _ArrChar1 = str1.ToCharArray();
        _ArrChar2 = str2.ToCharArray();
        _Result = new Result();
        _ComputeTimes = 0;
        _Row = _ArrChar1.Length + 1;
        _Column = _ArrChar2.Length + 1;
        _Matrix = new int[_Row, _Column];
    }
    /// <summary>
    /// 计算相似度
    /// </summary>
    public void Compute()
    {
        //开始时间
        _BeginTime = DateTime.Now;
        //初始化矩阵的第一行和第一列
        this.InitMatrix();
        int intCost = 0;
        for (int i = 1; i < _Row; i++)
        {
            for (int j = 1; j < _Column; j++)
            {
                if (_ArrChar1[i - 1] == _ArrChar2[j - 1])
                {
                    intCost = 0;
                }
                else
                {
                    intCost = 1;
                }
                //关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值 
                //循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离
                _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);
                _ComputeTimes++;
            }
        }
        //结束时间
        _EndTime = DateTime.Now;
        //相似率 移动次数小于最长的字符串长度的20%算同一题
        int intLength = _Row > _Column ? _Row : _Column;

        _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);
        _Result.UseTime = (_EndTime - _BeginTime).ToString();
        _Result.ComputeTimes = _ComputeTimes.ToString();
        _Result.Difference = _Matrix[_Row - 1, _Column - 1];
    }


    /// <summary>
    /// 计算相似度(不记录比较时间)
    /// </summary>
    public void SpeedyCompute()
    {
        //开始时间
        //_BeginTime = DateTime.Now;
        //初始化矩阵的第一行和第一列
        this.InitMatrix();
        int intCost = 0;
        for (int i = 1; i < _Row; i++)
        {
            for (int j = 1; j < _Column; j++)
            {
                if (_ArrChar1[i - 1] == _ArrChar2[j - 1])
                {
                    intCost = 0;
                }
                else
                {
                    intCost = 1;
                }
                //关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值 
                //循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离
                _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);
                _ComputeTimes++;
            }
        }
        //结束时间
        //_EndTime = DateTime.Now;
        //相似率 移动次数小于最长的字符串长度的20%算同一题
        int intLength = _Row > _Column ? _Row : _Column;

        _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);
        // _Result.UseTime = (_EndTime - _BeginTime).ToString();
        _Result.ComputeTimes = _ComputeTimes.ToString();
        _Result.Difference = _Matrix[_Row - 1, _Column - 1];
    }
    /// <summary>
    /// 计算相似度
    /// </summary>
    /// <param name="str1">字符串1</param>
    /// <param name="str2">字符串2</param>
    public void Compute(string str1, string str2)
    {
        this.StringComputeInit(str1, str2);
        this.Compute();
    }

    /// <summary>
    /// 计算相似度
    /// </summary>
    /// <param name="str1">字符串1</param>
    /// <param name="str2">字符串2</param>
    public void SpeedyCompute(string str1, string str2)
    {
        this.StringComputeInit(str1, str2);
        this.SpeedyCompute();
    }
    /// <summary>
    /// 初始化矩阵的第一行和第一列
    /// </summary>
    private void InitMatrix()
    {
        for (int i = 0; i < _Column; i++)
        {
            _Matrix[0, i] = i;
        }
        for (int i = 0; i < _Row; i++)
        {
            _Matrix[i, 0] = i;
        }
    }
    /// <summary>
    /// 取三个数中的最小值
    /// </summary>
    /// <param name="First"></param>
    /// <param name="Second"></param>
    /// <param name="Third"></param>
    /// <returns></returns>
    private int Minimum(int First, int Second, int Third)
    {
        int intMin = First;
        if (Second < intMin)
        {
            intMin = Second;
        }
        if (Third < intMin)
        {
            intMin = Third;
        }
        return intMin;
    }
    #endregion
}
/// <summary>
/// 计算结果
/// </summary>
public struct Result
{
    /// <summary>
    /// 相似度
    /// </summary>
    public decimal Rate;
    /// <summary>
    /// 对比次数
    /// </summary>
    public string ComputeTimes;
    /// <summary>
    /// 使用时间
    /// </summary>
    public string UseTime;
    /// <summary>
    /// 差异
    /// </summary>
    public int Difference;
}

调用方法:

// 方式一
StringCompute stringcompute1 = new StringCompute();
stringcompute1.SpeedyCompute("对比字符一", "对比字符二");    // 计算相似度, 不记录比较时间
decimal rate = stringcompute1.ComputeResult.Rate;         // 相似度百分之几,完全匹配相似度为1

// 方式二
StringCompute stringcompute2 = new StringCompute();
stringcompute2.Compute();                                  // 计算相似度, 记录比较时间
string usetime = stringcompute2.ComputeResult.UseTime;     // 对比使用时间

 

 

原文地址:https://www.cnblogs.com/vipstone/archive/2012/08/16/2642679.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


项目中经常遇到CSV文件的读写需求,其中的难点主要是CSV文件的解析。本文会介绍CsvHelper、TextFieldParser、正则表达式三种解析CSV文件的方法,顺带也会介绍一下CSV文件的写方法。 CSV文件标准 在介绍CSV文件的读写方法前,我们需要了解一下CSV文件的格式。 文件示例 一
简介 本文的初衷是希望帮助那些有其它平台视觉算法开发经验的人能快速转入Halcon平台下,通过文中的示例开发者能快速了解一个Halcon项目开发的基本步骤,让开发者能把精力完全集中到算法的开发上面。 首先,你需要安装Halcon,HALCON 18.11.0.1的安装包会放在文章末尾。安装包分开发和
这篇文章主要简单记录一下C#项目的dll文件管理方法,以便后期使用。 设置dll路径 参考C#开发奇技淫巧三:把dll放在不同的目录让你的程序更整洁中间的 方法一:配置App.config文件的privatePath : &lt;runtime&gt; &lt;assemblyBinding xml
在C#中的使用JSON序列化及反序列化时,推荐使用Json.NET——NET的流行高性能JSON框架,当然也可以使用.NET自带的 System.Text.Json(.NET5)、DataContractJsonSerializer、JavaScriptSerializer(不推荐)。
事件总线是对发布-订阅模式的一种实现,是一种集中式事件处理机制,允许不同的组件之间进行彼此通信而又不需要相互依赖,达到一种解耦的目的。&#xA;EventBus维护一个事件的字典,发布者、订阅者在事件总线中获取事件实例并执行发布、订阅操作,事件实例负责维护、执行事件处理程序。
通用翻译API的HTTPS 地址为https://fanyi-api.baidu.com/api/trans/vip/translate,使用方法参考通用翻译API接入文档 。&#xA;请求方式可使用 GET 或 POST 方式(Content-Type 请指定为:application/x-www-for
词云”由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于2006年最先使用,是通过形成“关键词云层”或“关键词渲染”,对文本中出现频率较高的“关键词”的视觉上的突出。词云图过滤掉大量的文本信息,使浏览者只要一眼扫过文本就可以领略文本的主旨。&#xA;网上大部分文章介绍的是使用P
微软在.NET中对串口通讯进行了封装,我们可以在.net2.0及以上版本开发时直接使用SerialPort类对串口进行读写操作。&#xA;为操作方便,本文对SerialPort类做了一些封装,暂时取名为**SerialPortClient**。
简介 管道为进程间通信提供了平台, 管道分为两种类型:匿名管道、命名管道,具体内容参考.NET 中的管道操作。简单来说,匿名管道只能用于本机的父子进程或线程之间,命名管道可用于远程主机或本地的任意两个进程,本文主要介绍命名管道的用法。 匿名管道在本地计算机上提供进程间通信。 与命名管道相比,虽然匿名
目录自定义日志类NLog版本的日志类Serilog版本的日志类 上个月换工作,新项目又要重新搭建基础框架,把日志实现部分单独记录下来方便以后参考。 自定义日志类 代码大部分使用ChatGPT生成,人工进行了测试和优化,主要特点: 线程安全,日志异步写入文件不影响业务逻辑 支持过期文件自动清理,也可自
[TOC] # 原理简介 本文参考[C#/WPF/WinForm/程序实现软件开机自动启动的两种常用方法](https://blog.csdn.net/weixin_42288432/article/details/120059296),将里面中的第一种方法做了封装成**AutoStart**类,使
简介 FTP是FileTransferProtocol(文件传输协议)的英文简称,而中文简称为“文传协议”。用于Internet上的控制文件的双向传输。同时,它也是一个应用程序(Application)。基于不同的操作系统有不同的FTP应用程序,而所有这些应用程序都遵守同一种协议以传输文件。 FTP
使用特性,可以有效地将元数据或声明性信息与代码(程序集、类型、方法、属性等)相关联。 将特性与程序实体相关联后,可以在运行时使用反射这项技术查询特性。&#xA;在 C# 中,通过用方括号 ([]) 将特性名称括起来,并置于应用该特性的实体的声明上方以指定特性。
# 简介 主流的识别库主要有ZXing.NET和ZBar,OpenCV 4.0后加入了QR码检测和解码功能。本文使用的是ZBar,同等条件下ZBar识别率更高,图片和部分代码参考[在C#中使用ZBar识别条形码](https://www.cnblogs.com/w2206/p/7755656.htm
C#中Description特性主要用于枚举和属性,方法比较简单,记录一下以便后期使用。 扩展类DescriptionExtension代码如下: using System; using System.ComponentModel; using System.Reflection; /// &lt;
本文实现一个简单的配置类,原理比较简单,适用于一些小型项目。主要实现以下功能:保存配置到json文件、从文件或实例加载配置类的属性值、数据绑定到界面控件。&#xA;一般情况下,项目都会提供配置的设置界面,很少手动更改配置文件,所以选择以json文件保存配置数据。
前几天用SerialPort类写一个串口的测试程序,关闭串口的时候会让界面卡死。网上大多数方法都是定义2个bool类型的标记Listening和Closing,关闭串口和接受数据前先判断一下。我的方法是DataReceived事件处理程序用this.BeginInvoke()更新界面,不等待UI线程
约束告知编译器类型参数必须具备的功能。 在没有任何约束的情况下,类型参数可以是任何类型。 编译器只能假定 System.Object 的成员,它是任何 .NET 类型的最终基类。 如果客户端代码使用不满足约束的类型,编译器将发出错误。 通过使用 where 上下文关键字指定约束。&#xA;最常用的泛型约束为
protobuf-net是用于.NET代码的基于契约的序列化程序,它以Google设计的“protocol buffers”序列化格式写入数据,适用于大多数编写标准类型并可以使用属性的.NET语言。&#xA;protobuf-net可通过NuGet安装程序包,也可直接访问github下载源码:https:/
工作中经常遇到需要实现TCP客户端或服务端的时候,如果每次都自己写会很麻烦且无聊,使用SuperSocket库又太大了。这时候就可以使用SimpleTCP了,当然仅限于C#语言。&#xA;SimpleTCP是一个简单且非常有用的 .NET 库,用于处理启动和使用 TCP 套接字(客户端和服务器)的重复性任务