Windows TCP连接失败和重新传输

如何解决Windows TCP连接失败和重新传输

我在Windows上运行的复杂应用程序中遇到间歇性的TCP连接问题。

我正在尝试确定问题出在我的代码还是Windows本身的错误。

系统由客户端应用程序,服务器应用程序和Web应用程序GUI组成。 GUI通过API端口连接到服务器,而客户端应用程序通过其他端口连接。

我的测试设置使客户端程序通过SSH隧道连接,该SSH隧道重定向到与客户端在同一系统上运行的服务器。服务器还在另一个线程上监听localhost上的API端口。

代码在VMware工作站的Windows 10的内部版本2004上运行。

在某些时间点,服务器暂时停止响应SYN数据包。建立新的连接需要2到3秒钟,而由于重新传输,现有的连接会出现延迟。由于从服务器/ Windows的角度来看,所有连接都来自本地主机,并且发生在两个不同的线程上,因此我以自己的代码(可能解释该问题)用尽了所有解释。

问题每20分钟出现一次。这也让我怀疑还有其他错误与我的代码无关。

我有机会从使用CURL的连接尝试中获取数据包转储。看起来像这样:

enter image description here

从图中可以看出,服务器响应之间的本地主机有3秒的延迟!该服务器是一个非常简单的轮询设计,我无法发现问题所在。负责接受此连接的服务器代码如下:


cR<void> cWindowsTCPServer::HasConnectionsPending()
{
    fd_set ReadSet = {};

    FD_ZERO(&ReadSet);

    FD_SET((SOCKET)_GenericFD,&ReadSet);

    timeval Timeout = {};
    // This select is not a bug on windows. The nSocks argument is ignored.
    uint32_t SelectResult = select(NULL,&ReadSet,NULL,&Timeout);

    if (SelectResult == SOCKET_ERROR)
        return cR<void>(false);

    return cR<void>(FD_ISSET((SOCKET)_GenericFD,&ReadSet) != 0);
}

cR<std::shared_ptr<iSocketBase>> cWindowsTCPServer::AcceptConnection()
{
    uint32_t TempFD = INVALID_SOCKET;

    sockaddr_in RemoteAddress = {};

    uint32_t AddrLength = sizeof(RemoteAddress);

    TempFD = (uint32_t)accept(_GenericFD,(sockaddr*)&RemoteAddress,(int*)&AddrLength);

    if (TempFD == INVALID_SOCKET)
        return cR<std::shared_ptr<iSocketBase>>(false);
    // This would not work for IPv6,but ipv4 is hardcoded in all clients that connect here...
    std::string Ip      = inet_ntoa(RemoteAddress.sin_addr);
    uint16_t    Port = ntohs(RemoteAddress.sin_port);

    return cR<std::shared_ptr<iSocketBase>>(true,std::make_shared<cWindowsTCPSocket>(TempFD,Ip,Port));
}

void cAPIServer::handle_server()
{
    while ((bool)_server_socket->HasConnectionsPending() == true)
    {
        auto accepted_client = _server_socket->AcceptConnection();

        std::thread(&cAPIServer::handle_client,this,accepted_client.Value()).detach();
    }
}

void cAPIServer::server_main()
{
    while (_is_running == true)
    {
        handle_server();

        std::this_thread::sleep_for(std::chrono::milliseconds(5));
    }
}

客户端,服务器和SSH一起以每秒​​〜6的速率循环通过未使用的端口。但是从我读过的所有内容来看,直到客户端每秒使用约33个连接后,Windows端口耗尽问题才出现。在perfmon和netstat中,一次处于活动状态的连接永远不会超过22个。我只看到大约60个处于​​“ TIME_WAIT”状态的连接在被系统回收之前。有64k端口可用于连接,所以我认为不是那样。

它的显示间隔始终为20分钟左右。端口耗尽问题也只会影响新的连接。但是在屏幕截图中,很明显,在建立连接之后,来自客户端的第一个承载数据的数据包也被重传了两次。

我的代码有误吗?还是我想念的东西?

编辑:

此后,我进行了以下实验:

  • 在VM上运行客户端,在我的主机窗口上运行服务器10 机。结果是一样的。

  • 删除所有其他网络适配器(例如OpenVPN),即使 这些都不活跃。结果是一样的。

  • 重新引导所涉及的系统。结果是一样的。

  • 禁用Windows Defender实时扫描。结果是一样的。

  • 当我发现发生以下情况的数据包丢失时,打开一个ncat侦听器 另一个端口,然后连接。似乎比平时还慢,但是我 没有花时间准确地进行测量,所以我可能是错的。

  • 运行netsh跟踪会话并打开事件(没什么特别的,但是有很多事件,因此我很容易错过了一些东西)。

  • 禁用mmp和配置文件(Windows中的某种TCP syn Flood保护),

  • 将客户端直接连接到服务器而不是SSH隧道,结果相同。

编辑2:

我注意到还有其他一些事情使我加深了神秘感。如果我终止了服务器和客户端,当发生丢包然后重新启动它们时,问题仍然存在。这一定是Windows中一些新颖的端口耗尽问题。

重启之间没有持久性。没有共享的数据库,共享的配置或任何其他类似的东西。客户端的服务器都未重用以前运行的状态,因此我认为这可以确认问题不在我的代码中。即使我指示代码使用其他端口,数据包仍会丢弃。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-