【论文推荐】通信相关论文开源代码本周推荐20231210

2022年开始的一个系列，主要是整理通信领域最近发表的提供开源代码和数据集的论文，这一期一共包含15篇论文，希望对相关领域的小伙伴有所帮助。获取这些论文的全文可以私信回复20231210，仅供大家交流学习。欢迎转发和关注！

号外：我们有开源代码交流群啦，欢迎感兴趣的老师和同学私信回复开源代码交流群。

号外：我们开始招募内容编辑志愿者了，欢迎对文献整理、推文创作、科研分享与合作感兴趣的小朋友们私信回复志愿者，也欢迎有期刊和会议征稿公益宣传需求的老师们与我联系沟通。

[1] Adversarial examples: A survey of attacks and defenses in deep learning-enabled cybersecurity systems

作者：Macas M, Wu C, Fuertes W.

出处：Expert Systems with Applications

摘要：在过去的几年里，机器学习在各个领域的应用取得了令人瞩目的成就。尤其是深度学习，已被广泛用于驱动计算机视觉、自然语言处理、机器翻译和网络安全等专业领域的应用程序和服务，产生的结果可与人类专家的表现相媲美甚至超越。然而，机器学习系统很容易受到对抗性攻击，特别是在存在实际对手的非平稳环境中，例如网络安全领域。在这项工作中，我们全面调查并介绍了针对基于深度学习的网络安全系统的基于对抗性示例的攻击的最新研究，强调了它们带来的风险并促进了有效的对策。为此，首先根据对抗性攻击方法发生的地点以及攻击者的目标和能力进行分类。然后，在八个主要网络安全应用类别的框架内详细审查基于对抗性示例的具体攻击和各自的防御方法。最后，概述了近期研究的主要趋势，并探讨了对抗性机器学习最新进展的影响，为网络安全的未来研究提供指导和方向。总之，这项工作首次系统地分析了网络安全领域基于示例的对抗性攻击，讨论了可能的防御措施，并强调了未来研究的有前景的方向。

链接：

https://www.sciencedirect.com/science/article/pii/S0957417423027252

数据：

https://github.com/mmacas11/Adversarial_Machine_Learning

[2] Anomaly Detection Dataset for Industrial Control Systems

作者：Dehlaghi-Ghadim A, Moghadam M H, Balador A, et al

出处：arXiv

摘要：在过去的几十年里，工业控制系统 (ICS) 一直是网络攻击的目标，并且随着越来越多的 ICS 连接到互联网，它变得越来越容易受到攻击。将机器学习 (ML) 用于入侵检测系统 (IDS) 是一种很有前景的 ICS 网络保护方法，但缺乏合适的数据集来评估 ML 算法是一个挑战。尽管有一些常用的数据集，但它们可能无法反映真实的 ICS 网络数据，缺乏有效异常检测的必要特征，或者已经过时。本文介绍了“ICS-Flow”数据集，该数据集为有监督和无监督的基于 ML 的 IDS 评估提供网络数据和过程状态变量日志。网络数据包括从模拟 ICS 组件和模拟网络捕获的正常和异常网络数据包和流量。这些异常通过黑客常用的各种攻击技术注入系统，以修改网络流量并危害 ICS。我们还提出了开源工具“ICSFlowGenerator”，用于从原始网络数据包生成网络流参数。最终数据集包含超过 25,000,000 个原始网络数据包、网络流记录和过程变量日志。本文描述了用于收集和标记数据集的方法，并提供了详细的数据分析。最后，我们实现了多个机器学习模型，包括决策树、随机森林和人工神经网络来检测异常和攻击，证明我们的数据集可以有效地用于训练入侵检测机器学习模型。

链接：

Anomaly Detection Dataset for Industrial Control Systems

数据：

GitHub - AlirezaDehlaghi/ICSFlow: This is the Network Flow Generator for ICSSIM

[3] Constraint-Aware Federated Scheduling for Data Center Workloads

作者：Thiyyakat M, Kalambur S, Sitaram D

出处：IoT

摘要：数据中心的使用无处不在，因为它们支持跨领域的多种技术来存储、处理和传播数据。物联网应用程序根据工作负载的性质利用云数据中心和边缘数据中心。由于物联网应用对延迟的严格要求，工作负载在 FPGA 和 GPU 等硬件加速器上运行，以实现更快的执行速度。此类硬件的引入以及数据中心机器的硬件和软件配置的现有变化增加了基础设施的异构性。最佳工作绩效需要满足任务布置约束。这是通过约束感知调度来实现的，其中任务被调度到具有适当机器配置的工作节点上。放置约束的存在限制了可用于运行任务的合适资源的数量，从而导致排队延迟。由于联合调度程序因其速度和可扩展性而受到重视，我们在约束感知上下文中评估了两个此类调度程序（Megha 和 Pigeon）的性能。我们通过将 Megha 的性能与最先进的联合调度程序 Pigeon（PigeonC）的约束感知版本进行比较，扩展了我们之前在 Megha 上的工作。我们对合成和真实世界集群轨迹进行的实验结果表明，与 PigeonC 相比，Megha 将作业响应时间延迟的 99% 减少了 10 倍。我们还描述了对 Megha 架构的增强，以提高其调度效率。

链接：

Constraint-Aware Federated Scheduling for Data Center Workloads

代码：

https://github.com/meghanat/megha-constraint-aware.git

[4] Cross-layer Federated Heterogeneous Ensemble Learning for Lightweight IoT Intrusion Detection System

作者：Hajj S, Azar J, Abdo J B, et al.

出处：2023 IEEE 10th International Conference on Data Science and Advanced Analytics (DSAA).

摘要：本文提出了一种用于入侵检测系统的异构联合集成模型，采用半监督新颖性检测技术-基线 K 均值。该技术从基线数据中学习正常流量，并利用马哈拉诺比斯距离来检测异常数据包。为了降低基于异常的入侵检测系统固有的误报率，我们提出了一种集成方法，该方法将专用于每个工作人员的本地新颖性检测模型集成到加权和基于投票的策略中。联合设计增强了每个工作人员的检测能力，而不会增加误报率。我们广泛的实验展示了该系统相对于传统独立 IDS 的稳健性和适应性，在不同采样率下的精度、召回率和 F1score 方面都有显着改进。我们在 Github 上公开了该项目的代码，以实现可复制性。

链接：

https://ieeexplore.ieee.org/abstract/document/10302497/

代码：

GitHub - josephazar/baselineKmeans: Semi-Supervised Lightweight IoT Intrusion Detection System

[5] EISim: A Platform for Simulating Intelligent Edge Orchestration Solutions

作者：Kokkonen H, Pirttikangas S, Lovén L.

出处：arXiv

摘要：为了支持未来智能和交互应用的严格要求，智能需要成为边缘环境中资源管理的重要组成部分。开发智能编排解决方案是一项具有挑战性和艰巨的任务，其中对所提出的解决方案的评估和比较是重点。仿真通常用于评估和比较所提出的解决方案。然而，目前现有的、公开的模拟器在支持智能边缘编排方法的研究方面缺乏支持。针对这一需求，本文提出了一种名为边缘智能模拟器（EISim）的仿真平台，其目的是促进智能边缘编排解决方案的研究。EISim 是从现有的名为 PureEdgeSim 的雾模拟器扩展而来的。在目前的形式下，EISim 支持在与边缘任务卸载和资源定价相关的场景中模拟基于深度强化学习的解决方案和不同的编排控制拓扑。该平台还包括用于创建模拟环境、运行模拟以进行代理培训和评估以及绘制结果的其他工具。

链接：

EISim: A Platform for Simulating Intelligent Edge Orchestration Solutions

代码：

GitHub - hennas/EISim: Edge Intelligence Simulator for testing and evaluating intelligent orchestration methods

[6] Enabling simulation services for digital twins of 5G/B5G mobile networks

作者：Nardini G, Stea G.

出处：Computer Communications

摘要：数字孪生 (DT) 被提议作为物理实体（例如制造设备）的数字复制品，人们可以实时观察并与之交互。网络数字孪生 (DTN) 在文献中越来越多地被讨论，作为高效数据驱动网络管理和性能驱动网络优化的推动者（例如，支持动态重新配置或预测故障影响）。DTN 包括服务映射模型，即可以输入获取的数据以产生对网络本身的洞察的模型-例如，基于多种底层技术（从机器学习到分析模型，例如运行假设场景）。在本文中，我们研究了专为 5G 及更高版本定制的移动网络 DTN（DTMN）的情况，其中动态重新配置和故障预测问题至关重要。我们认为，DTMN 应该提供模拟服务，以便实现性能驱动的网络优化，并且离散事件网络模拟器是用于此目的的理想工具。我们讨论了实现这一目标所需解决的挑战，例如集中式与分布式实施、从物理网络收集输入、安全问题和托管，并回顾了网络模拟在假设分析方面提供的可能性，定义锁步和分支分析的概念。我们提出了一个为 DTMN 提供仿真服务的框架，并使用 Simu5G（一种流行的 OMNeT++ 5G/B5G 仿真库）作为参考案例研究来举例说明。

链接：

Enabling simulation services for digital twins of 5G/B5G mobile networks

代码：

https://github.com/Unipisa/Simu5G

[7] ExPECA: An Experimental Platform for Trustworthy Edge Computing Applications

作者：Mostafavi S, Moothedath V N, Rönngren S, et al.

出处：arXiv

摘要：本文介绍了 ExPECA，这是一个边缘计算和无线通信研究测试平台，旨在解决两个紧迫的挑战：全面的端到端实验和高水平的实验再现性。ExPECA 利用基于 OpenStack 的 Chameleon 基础设施 (CHI) 框架的灵活性和易于操作性，位于独特的隔离地下设施中，为无线实验提供高度受控的环境。该测试床旨在促进通信和计算的综合研究，提供各种软件定义无线电（SDR）和商业现成（COTS）无线和有线链路以及容器化计算环境。我们使用 OpenRTiST（一种延迟敏感、带宽密集型应用程序）举例说明了测试台的实验可能性，并分析了其性能。最后，我们重点介绍了一系列可以从 ExPECA 功能中获益的研究领域和实验设置，包括闭环应用和时间敏感网络。

链接：

ExPECA: An Experimental Platform for Trustworthy Edge Computing Applications

代码：

GitHub - KTH-EXPECA/examples

[8] Industrial Environment Multi-Sensor Dataset for Vehicle Indoor Tracking with Wi-Fi, Inertial and Odometry Data

作者：Silva I, Pendão C, Torres-Sospedra J, et al.

出处：Data

摘要：本文描述了使用类似于配备多个传感器的工业车辆的移动单元在工业环境中收集的数据集。Wi-Fi 接口从可用的接入点 (AP) 收集信号，而运动传感器则收集有关移动设备运动（方向和位移）的数据。该数据集的显着特征包括来自多个传感器的同步数据收集，例如从多个接口（包括无线电地图）获取的 Wi-Fi 数据、两个低成本惯性测量单元 (IMU) 传感器提供的方向以及位移（行程）距离）由连接到移动单元轮子的绝对编码器测量。使用计算机视觉方法确定准确的地面实况信息，该方法记录移动单元通过参考位置时的时间戳。我们通过应用航位推算和 Wi-Fi 指纹识别的基线方法来评估所提出的数据集的质量。在不使用任何其他绝对定位技术的情况下，简单航位推算的平均定位误差对于 IMU1 和 IMU2 分别为 8.25 m 和 11.66 m。结合五个 Wi-Fi 接口的 RSSI 信息，简单 Wi-Fi 指纹识别的平均定位误差为 2.19 m。该数据集为工业 4.0 和移动传感领域做出了贡献，为研究人员提供了开发、测试和评估工业车辆室内跟踪解决方案的资源。

链接：

Industrial Environment Multi-Sensor Dataset for Vehicle Indoor Tracking with Wi-Fi, Inertial and Odometry Data

数据：

https://github.com/adafruit/Adafruit_CircuitPython_BNO055

[9] Latency-Aware Semi-Synchronous Client Selection and Model Aggregation for Wireless Federated Learning

作者：Yu L, Sun X, Albelaihi R, et al.

出处：Future Internet

摘要：联邦学习 (FL) 是一种协作机器学习 (ML) 框架，特别适合需要大量训练样本的 ML 模型，例如卷积神经网络 (CNN)、循环神经网络 (RNN) 和随机森林，在各种背景下应用程序，例如下一个单词预测和电子医疗。FL 涉及通过在每次全局迭代中将本地模型上传到 FL 服务器来参与训练过程的各种客户端。服务器聚合这些模型以更新全局模型。传统的 FL 过程可能会遇到瓶颈，称为落后者问题，即速度较慢的客户端会延迟整体训练时间。本文介绍了联邦学习的延迟感知半同步客户端选择和模型聚合（LESSON）方法。LESSON 允许客户以不同的频率参与：速度更快的客户更频繁地做出贡献，从而缓解掉队问题并加速收敛。此外，LESSON 通过设置不同的截止日期，在模型精度和收敛速度之间提供了可调节的权衡。仿真结果表明，LESSON 在收敛速度方面优于两种基线方法 FedAvg 和 FedCS，并且与 FedCS 相比保持了更高的模型精度。

链接：

Latency-Aware Semi-Synchronous Client Selection and Model Aggregation for Wireless Federated Learning

代码：

GitHub - fzvincent/FL_AoR

[10] Network intrusion detection using feature fusion with deep learning

作者：Ayantayo A, Kaur A, Kour A, et al

出处：Journal of Big Data

摘要：网络入侵检测系统（NIDS）是用于防御网络攻击的主要工具之一，深度学习在网络入侵检测方面取得了显着的成功。然而，特征融合对于如何提升深度学习模型的性能并提高其在NIDS中的泛化能力仍有待探索。在本文中，我们提出了具有不同特征融合机制的新型深度学习架构，旨在提高 NIDS 多分类组件的性能。我们提出了三种不同的深度学习模型，我们称之为早期融合、后期融合和后期集成学习模型，使用特征融合与完全连接的深度网络。我们的特征融合机制旨在鼓励深度学习模型更有效地学习不同输入特征之间的关系，并减轻特定特征类型可能出现的任何潜在偏差。为了评估我们的深度学习解决方案的有效性并与最先进的模型进行比较，我们采用了可广泛访问的 UNSW-NB15 和 NSL-KDD 数据集，这些数据集专门用于增强改进的 NIDS 的开发和评估。通过定量分析，我们证明了我们提出的模型在有效解决多分类任务带来的挑战方面的弹性，特别是在存在类别不平衡问题的情况下。此外，我们的后期融合和后期集成模型显示出最佳的泛化行为（防止过度拟合），并且在训练和验证集上具有相似的性能。

链接：

https://link.springer.com/article/10.1186/s40537-023-00834-0

代码：

https://github.com/deen-g/NIDS-MODELS

[11] OSF-EIMTC: An open-source framework for standardized encrypted internet traffic classification

作者：Bader O, Lichy A, Dvir A, et al

出处：Computer Communications

摘要：互联网流量分类在网络可见性、服务质量 (QoS)、入侵检测、体验质量 (QoE) 和流量趋势分析中发挥着关键作用。为了提高隐私性、完整性、机密性和协议混淆，当前的流量基于加密协议，例如 SSL/TLS。随着文献中机器学习（ML）和深度学习（DL）模型的使用越来越多，由于缺乏标准化框架，不同模型和方法之间的比较变得繁琐和困难。在本文中，我们提出了一个名为 OSF-EIMTC 的开源框架，它可以提供学习过程和模拟再现性的完整流程。从众所周知的数据集到提取新的众所周知的特征，它提供了著名的 ML 和 DL 模型（来自流量分类文献）的实现以及实验测试台及其评估。通过提供标准化平台，OSF-EIMTC 能够对已建立的和新颖的特征和模型进行可重复、可再现和准确的比较。作为框架评估的一部分，我们利用多个数据集、模型和特征集，展示了该框架可以使用的各种情况的可重复性。我们展示了对公开数据集的分析，并邀请社区使用 OSF-EIMTC 参与我们的公开挑战，促进加密流量分类方面的协作进步。

链接：

OSF-EIMTC: An open-source framework for standardized encrypted internet traffic classification

代码：

https://github.com/ArielCyber/OSF-EIMTC

[12] PAC-GPT: A Novel Approach to Generating Synthetic Network Traffic With GPT-3

作者：Kholgh D K, Kostakos P

出处：IEEE Access

摘要：机器学习模型的应用，特别是在网络安全领域的应用，在过去几年中大幅增长。然而，这些模型的有效性主要取决于它们摄取的训练数据的质量和广度。网络安全领域真实数据集的稀缺对开发用于实际应用场景的工业级工具构成了相当大的挑战。具体来说，当前的数据集要么明显过时，要么在定性和定量方面都存在不足，这主要是因为许多组织出于隐私问题或对商业秘密的潜在威胁而不愿共享数据。为了应对这一挑战，本文介绍了 PAC-GPT，这是一种新颖的框架，可为基于 Open AI 的生成式预训练 Transformer 3 (GPT-3) 的机器学习方法生成可靠的合成数据。该框架的核心组件是两个模块，即流生成器（负责捕获和重新生成一系列网络数据包中的模式）和数据包生成器（可以在给定网络流的情况下生成单独的网络数据包）。我们还提出了一种基于 LLM 链接的数据包生成器，然后使用丢失、准确度和成功率等指标来评估、比较和评估其性能，得出的结论是，Transformer是一种适合进行合成数据包生成的方法，只需执行最少的微调。最后，设计了一个简化的命令行界面（CLI）工具，以方便来自不同学科的专业人员无缝访问这种创新的数据生成策略。

链接：

https://ieeexplore.ieee.org/abstract/document/10287342/

代码：

https://github.com/dark-0ne/NetworkPacketGenerator

[13] quicSDN: Transitioning from TCP to QUIC for southbound communication in SDNs

作者：Kumar P, Dezfouli B.

出处：Journal of Network and Computer Applications

摘要：在软件定义网络 (SDN) 中，控制平面和数据平面出于各种目的进行通信，例如应用配置和收集统计数据。虽然已经提出了各种方法来减少开销并增强软件定义网络（SDN）的可扩展性，但用于南向通信的传输层协议的影响尚未得到研究。现有的 SDN 依靠传输控制协议 (TCP)（和传输层安全性 (TLS)）来增强可靠性和安全性。在本文中，我们展示了 TCP 的使用给南向通信带来了相当大的开销，确定了这种开销的原因，并演示了如何用快速 UDP Internet 连接 (QUIC) 替换 TCP 来增强此通信的性能。我们引入了quicSDN架构，通过QUIC协议实现SDN中的南向通信。我们提出了一个基于 SDN 社区最广泛使用的标准协议的参考架构，并展示了如何改进控制器和交换机以促进这种过渡。我们从分析和实证角度比较了 quicSDN 与传统 SDN 架构的性能，并确认了 quicSDN 的优越性能。我们在不同环境下的实证评估表明，与使用 TCP 进行南向通信的 SDN 相比，quicSDN 的通信开销和消息传递延迟分别降低了 82% 和 45%。

链接：

https://www.sciencedirect.com/science/article/pii/S1084804523001996

代码：

GitHub - SIOTLAB/quicSDN: A QUIC based implementation of software defined networking (SDN). This allows using QUIC instead of TCP for southbound communication in SDNs.

[14] Sample-Driven Federated Learning for Energy-Efficient and Real-Time IoT Sensing

作者：Luu M N, Nguyen M D, Bedeer E, et al

出处：arXiv

摘要：在联邦学习（FL）系统领域，最新的前沿方法严重依赖于理想条件收敛分析。具体来说，这些方法假设物联网设备上的训练数据集具有与全局数据分布类似的属性。然而，这种方法无法捕获实时传感 FL 系统中的全部数据特征。为了克服这一限制，我们建议采用一种专为具有实时传感功能的物联网网络设计的新方法系统。我们的方法考虑了由于用户数据采样过程而产生的泛化差距。通过有效控制这个采样过程，我们可以减轻过度拟合问题并提高整体准确性。特别是，我们首先提出一个优化问题，利用采样过程来同时减少过度拟合，同时最大限度地提高准确性。为了实现这一目标，我们的代理优化问题擅长处理能源效率，同时以高泛化性优化准确性。为了解决高复杂度的优化问题，我们引入了一种在线强化学习算法，名为样本驱动联邦学习控制（SCFL），基于 Soft Actor-Critic（A2C）框架。这使得代理即使在不断变化的环境中也能够动态适应并找到全局最优值。通过利用 SCFL 的功能，我们的系统为具有实时传感功能的 FL 系统中的资源分配提供了一种有前景的解决方案。

链接：

Sample-Driven Federated Learning for Energy-Efficient and Real-Time IoT Sensing

代码：

https://github.com/Skyd-FL/SCFL/blob/main/results/theoretical_evals/Lsmooth_Estimation.ipynb

[15] Semi-2DCAE: a semi-supervision 2DCNN AutoEncoder model for feature representation and classification of encrypted traffic

作者：Cui J, Bai L, Li G, et al.

出处：PeerJ Computer Science

摘要：流量分类在网络管理、监控和安全等网络相关领域至关重要。随着加密互联网流量比例的上升，基于端口和基于DPI的流量分类方法的准确性有所下降。基于机器学习和深度学习的方法有效提高了流量分类的准确率，但仍存在流量结构特征提取不充分、特征代表性差等问题。本文提出了一种称为半监督二维卷积自动编码器（Semi-2DCAE）的模型。该模型通过二维卷积神经网络（2D-CNN）提取原始网络流量中的空间结构特征，并利用自动编码器结构对数据进行降尺度，使得不同的流量特征表示为一维不同区间的谱线。维度标准坐标系，我们称之为 FlowSpectrum。本文在模型中加入PRuLe激活函数，保证训练过程的稳定性。我们使用ISCX-VPN2016数据集来测试FlowSpectrum模型的分类效果。实验结果表明，该模型能够在一维坐标系下表征加密流量特征，并对非VPN加密流量进行分类，准确率高达99.2%，比最先进的解决方案提高了约7%。VPN 加密流量的准确率高达 98.3%，比最先进的解决方案提高了约 2%。

链接：

Semi-2DCAE: a semi-supervision 2D-CNN AutoEncoder model for feature representation and classification of encrypted traffic

代码：

https://doi.org/10.5281/zenodo.8154325

回顾ICC 2022的开源代码【论文推荐】ICC 2022 开源代码汇总

回顾ICC 2023的开源代码【论文推荐】ICC 2023开源代码汇总

回顾GLOBECOM 2022的开源代码【论文推荐】GLOBECOM 2022 开源代码汇总

回顾WCNC 2022的开源代码【论文推荐】WCNC 2022 开源代码汇总

回顾WCNC 2023的开源代码【论文推荐】WCNC 2023开源代码汇总

回顾INFOCOM 2022的开源代码【论文推荐】INFOCOM 2022 开源代码汇总

回顾INFOCOM 2023的开源代码【论文推荐】INFOCOM 2023开源代码汇总

获取最全最新的【论文推荐】卫星网络仿真工具和开源代码汇总