ترجمه عنوان مقاله | یادگیری تقویتی عمیق برای دفاع از حملات سایبری سیستم توزیع با DERها |
عنوان انگلیسی مقاله | Deep Reinforcement Learning for Distribution System Cyber Attack Defense with DERs |
نشریه | آی تریپل ای – IEEE |
سال انتشار | ۲۰۲۳ |
تعداد صفحات مقاله انگلیسی | ۵ صفحه |
هزینه | دانلود مقاله انگلیسی رایگان میباشد. |
مقاله بیس | این مقاله بیس نمیباشد |
نوع مقاله | ISI |
فرمت مقاله انگلیسی | |
شناسه ISSN | ۲۴۷۲-۸۱۵۲ |
فرضیه | ندارد |
مدل مفهومی | ندارد |
پرسشنامه | ندارد |
متغیر | ندارد |
رفرنس | دارد |
رشته های مرتبط | فناوری اطلاعات – کامپیوتر – مهندسی برق |
گرایش های مرتبط | اینترنت و شبکه های گسترده – امنیت اطلاعات – هوش مصنوعی – مهندسی الکترونیک – مهندسی کنترل |
نوع ارائه مقاله |
ژورنال |
مجله / کنفرانس | کنفرانس فناوری های نوآورانه شبکه هوشمند برق و انرژی – Power & Energy Society Innovative Smart Grid Technologies Conference |
دانشگاه | Department of Electrical and Computer Engineering, University of Connecticut, Storrs, CT, USA |
کلمات کلیدی | حمله سایبری – سیستم های توزیع فعال – تولید تجدیدپذیر – یادگیری تقویتی عمیق |
کلمات کلیدی انگلیسی | Cyber attack – Active distribution systems – Renewable generation – Deep reinforcement learning |
شناسه دیجیتال – doi |
https://doi.org/10.1109/ISGT51731.2023.10066375 |
لینک سایت مرجع |
https://ieeexplore.ieee.org/document/10066375 |
کد محصول | Ar402040005 |
وضعیت ترجمه مقاله | این مقاله در حال ترجمه است. |
دانلود رایگان مقاله | |
سفارش ترجمه مقاله | ثبت سفارش ترجمه مقاله |
Abstract
Introduction
Problem Formulation
Proposed Extended SAC-Based DRL Control for Cyber Attack Mitigation
Numerical Results
REFERENCES
Abstract
The use of smart inverter capabilities of distributed energy resources (DERs) enhances the grid reliability but in the meanwhile exhibits more vulnerabilities to cyber-attacks. This paper proposes a deep reinforcement learning (DRL)-based defense approach. The defense problem is reformulated as a Markov decision making process to control DERs and minimizing load shedding to address the voltage violations caused by cyber-attacks. The original soft actor-critic (SAC) method for continuous actions has been extended to handle discrete and continuous actions for controlling DERs’ setpoints and load shedding scenarios. Numerical comparison results with other control approaches, such as Volt-VAR and Volt-Watt on the modified IEEE 33-node, show that the proposed method can achieve better voltage regulation and have less power losses in the presence of cyber-attacks.
Introduction
S Mart control of distributed energy resources (DER) in distribution systems is bringing a fundamental shift in how these networks are maintained within the security limits. Historically, control methods were designed based on conventional approaches, where cyber threats have not been paid attention [1]. The idea of introducing internet protocols in the electrical network to use more advanced protection and control components has created the need to defend the cyberattacks. Furthermore, a study on [2], [3] has showed that only 62% of cyber-attacks can be recognized after they cause massive damage to the system, which makes it a critical issue for system designers. Nowadays, the digital transformation of the electrical distribution systems has forced lots of restrictions and regulations that must be applied for achieving a secure and resilient system [4]. In the context of cyber physical security [5], [6], smart attackers can initiate false data injection attacks (FDI) [7], where a slight change in any of the controllable devices (i.e., smart inverters, smart ring main units and digital relays), can result in disturbing the networking security without being detected by existing defense approaches. In this paper, we propose a learning-based approach for the mitigation of cyber-attacks on connected loads and DERs. Deep reinforcement learning (DRL) was opted for its superior capability of learning the power system constraints and achieving optimal control strategy
Numerical Results
TS A modified IEEE 33-node system with three-phase loads and 4 DERs that are utility-owned (i.e., each DER consists of 1 ES unit and 1 PV with installed capacities of 500 kW each unit), is used for testing. The system is modeled using OpenDSS and is configured to be in the grid connected mode. At the first solution evaluated using OpenDSS, no voltage violation has been observed during the normal operation. In addition, 4 tie switches have been added to the network an sectionalizers are considered for operation. The learning environment is designed according to OpenAI Gym [14], which is a common interfacing library to define DRL environment for the agent. The SAC algorithm is implemented using PyTorch. Specifically, in the SAC, both actor and critic networks are designed as feed-forward neural networks with three hidden layers of 50, 100 and 50 neurons and a ReLU activation function for each layer. Other SAC hyper-parameters are as follows: Adam optimizer is used with a learning rate of 0.0001 and discount factor γ is set to 0.9. The target network is updated by tau = 0.001 and random process is applied for better exploration with α = ۰٫۱, β = ۰٫۱ ρ = ۱۰ and µ = ۰٫۱; the replay buffer size is 100000 with batch size 256. The offline DRL training spends around 3 hours and 30 minutes on a laptop computer with 3.6GHz Intel i7 processor and 32.0 GB RAM. The proposed DRL defense algorithm is compared with other control algorithms, such as the Volt-VAR and Volt-Watt using the default control curves in Open DSS [15]). Also, the MPC algorithm is implemented following [16] based on the problem formulation in Section II using the same control and state variables for the proposed DRL algorithm. Attacks are initiated for few timesteps by changing the load and DER setpoints (% power change of loads and/or DERs) in Open DSS using python interface.
چکیده
معرفی
فرمول مسأله
کنترل DRL مبتنی بر SAC برای کاهش حملات سایبری پیشنهاد شده است
نتایج عددی
منابع
چکیده– استفاده از قابلیتهای اینورتر هوشمند منابع انرژی توزیعشده (DER)، قابلیت اطمینان شبکه را افزایش داده، اما در عین حال آسیبپذیریهای بیشتری را در برابر حملات سایبری از خود نشان میدهد. این مقاله یک رویکرد دفاعی مبتنی بر یادگیری تقویتی عمیق (DRL) را پیشنهاد میدهد. مسئله دفاع به عنوان یک فرآیند تصمیم گیری “مارکوف” مجدداً فرمول بندی شده است تا کنترل DERها و به حداقل رساندن حذف بار برای حل مشکل اضافه ولتاژ ناشی از حملات سایبری انجام شود. روش اصلی منتقد-عملگر نرم (SAC) برای اقدامات پیوسته گسترش یافته است تا به اقدامات گسسته و پیوسته برای کنترل نقاط تنظیم DERها و سناریوهای حذف بار رسیدگی کند. نتایج مربوط به مقایسه عددی روش پیشنهادی با سایر رویکردهای کنترلی، نظیر ولت-ولت آمپر راکتیو (Volt-VAR) و ولت-وات (Volt-Watt) بر روی شبکه 33-گره IEEE اصلاح شده، نشان میدهد که روش پیشنهادی میتواند به تنظیم ولتاژ بهتری دست یابد و تلفات توان کمتری در حضور حملات سایبری داشته باشد.
کلمات کلیدی–حمله سایبری، سیستمهای توزیع فعال، تولید انرژیهای تجدیدپذیر، یادگیری تقویتی عمیق.
Views: 8
نقد و بررسیها
هنوز بررسیای ثبت نشده است.