[2026-03-10] Developing Realistic Distributed Denial of Service (DDoS) Attack Dataset and Taxonomy
๐ฆฅ ๋ณธ๋ฌธ
Motivation
ML๋ ๋ฐ์ดํฐ์ ์ฌ์ ๋ถํฌ๋ฅผ ์์ง ๋ชปํด๋ ๋ณต์กํ ํจํด์ ์ค์ค๋ก ํ์ตํ์ฌ ๋ฅ๋ ฅ์ด ํ์ํ์ง๋ง ํ์ง ์ฑ๋ฅ์ ๊ทน๋ํํ๋ Feature๋ฅผ ์ฐพ๋ ๊ฒ์ด ์ค์ํจ
๊ธฐ์กด ๋ฐฉ๋ฒ์ ๋ฌธ์ ์
- ์๋์ ๋ค๋จ์ด์ง๊ฑฐ๋ ๋นํ์ค์ ์ธ ๊ณต๊ฒฉ ์๋๋ฆฌ์ค
- ํ๋์ ์ธ ๋ฐ์ฌ์ฉ DDoS ๊ณต๊ฒฉ์ด ํฌํจ๋์ง ์์
- ์๋ จ๋ ๊ณต๊ฒฉ์์ ์ง๋ฅ์ ์ธ ๊ธฐ์ ๋ณด๋ค ์ด๋ณด์ ์ธ ์์ค์ ๊ณต๊ฒฉ ์๋๋ฆฌ์ค
- Real Word์ ๊ณต๊ฒฉ ์์๊ณผ ๋๋จ์ด์ง ํฉ์ฑ ๋ฐ์ดํฐ์
- ๊ฐ์ธ ์ ๋ณด ๋ณดํธ๋ฅผ ์ํ ํ์ด๋ก๋ ์ ๊ฑฐ์ ์ต๋ช
ํ๋ก ์ธํ ๋ฐ์ดํฐ ์ ์ค
- ์ ํ๋ฆฌ์ผ์ด์ ๊ณ์ธต ๊ณต๊ฒฉ์ด ์ ๊ตํด์ง๋ฉด์ ํ์ด๋ก๋์ ๊ธธ์ด๋ ํจํด ๋ถ์์ด ํ์
- Real World์์์ ๋ฐ์ดํฐ์ ์ ์ฌํ์ง ์์
- ๋ฐ์ดํฐ ๋ถ์์ ์ฑ
- ํธ๋ํฝ์ ๊ธฐ์์ด ๋ถ๋ถ๋ช ํ๊ณ ๋ฐ์ดํฐ์ ์์ค๊ฐ ๋ค์ํ์ง ๋ชปํจ
- ๊ณต๊ฒฉ์-ํฌ์์ ๊ฐ์ ์์ ํ ์ํธ์์ฉ์ ์บก์ฒํ์ง ๋ชปํจ
DDOS ATTACKS TAXONOMY
์์ฉ ๊ณ์ธต์์ TCP/UDP ๊ธฐ๋ฐ ํ๋กํ ์ฝ์ ์ฌ์ฉํ์ฌ ์ํ๋ ์ ์๋ ์๋ก์ด ๊ณต๊ฒฉ๋ค์ ๋ถ์ํ๊ณ ์๋ก์ด ๋ถ๋ฅ ์ฒด๊ณ๋ฅผ ์ ์

๋ฐ์ฌ ๊ธฐ๋ฐ(Reflection-based) DDoS
์ ๋นํ ์ 3์ ๊ตฌ์ฑ ์์๋ฅผ ํ์ฉํ์ฌ ๊ณต๊ฒฉ์์ ์ ์์ ์จ๊ธฐ๋ ์ข ๋ฅ์ ๊ณต๊ฒฉ
- ๋์ ํ๋ฆ
- ๊ณต๊ฒฉ์๋ src IP ์ฃผ์๋ฅผ ํฌ์์ IP ์ฃผ์๋ก Spoofing.
- ๋ฐ์ฌ ์๋ฒ(Reflector Server)๋ก ํจํท์ ๋ณด๋
- ๋ฐ์ฌ ์๋ฒ๊ฐ ํฌ์์๋ก ์๋ต ํจํท์ ๋ณด๋ด์ด, ํฌ์์ ์๋ฒ๋ฅผ DoS ์ํด
- ํน์ง : TCP/UDP๋ฅผ ์ฌ์ฉํ๋ ์์ฉ ๊ณ์ธต์ ํ๋กํ ์ฝ์ ์ฌ์ฉ
์ ์ฉ ๊ธฐ๋ฐ(Exploitation-based) ๊ณต๊ฒฉ
TCP/UDP ๊ธฐ๋ฐ ํ๋กํ ์ฝ์ ์ทจ์ฝ์ ์ ์ด์ฉํ๋ ์ข ๋ฅ์ ๊ณต๊ฒฉ
- ๊ณต๊ฒฉ ์ข
๋ฅ
- SYN Flood : TCP 3-way handshake๋ฅผ ์
์ฉํ์ฌ ์๋ฒ ์์์ ์๋ชจํ๋ ๊ณต๊ฒฉ
- src IP๋ฅผ spoofed IP๋ฅผ ์ฌ์ฉํ์ฌ SYN์ ๋ณด๋
- ์๋ IP์ด๋ฏ๋ก Server๋ ACK๋ฅผ ๋ฐ์ง ๋ชปํดhalf-open ์ํ๋ฅผ ์ ์ง
- TCP ํ๋ฅผ ๋์น๊ฒ ํ์ฌ ์๋ฒ ์์์ ์๋ชจ ์ํด
- UDP Flood : ์ฌ๋ฌ ๋๋ค ํฌํธ๋ก UDP ํจํท์ ๋๋์ผ๋ก ๋ณด๋ด๋ ๊ณต๊ฒฉ
- UDP-Lag : ํด๋ผ์ด์ธํธ์ ์๋ฒ ์ฌ์ด์ ์ฐ๊ฒฐ์ ๋ฐฉํดํ๋ ๊ณต๊ฒฉ.
- ๋ ๊ฐ์ง ๋ฐฉ๋ฒ
- lag switch ๋ผ๊ณ ๋ถ๋ฆฌ๋ ํ๋์จ์ด ์ฅ๋น๋ฅผ ์ฌ์ฉ
- ๋ค๋ฅธ ์ฌ์ฉ์๋ค์ ๋์ญํญ์ ์ ์ ํ๋ ์ํํธ์จ์ด ํ๋ก๊ทธ๋จ ์ฌ์ฉ
- ์จ๋ผ์ธ ๊ฒ์์์ ๋ค๋ฅธ ํ๋ ์ด์ด์ ์์ง์์ ๋ฐฉํดํ๊ธฐ ์ํด ์ฌ์ฉ
- ๋ ๊ฐ์ง ๋ฐฉ๋ฒ
- SYN Flood : TCP 3-way handshake๋ฅผ ์
์ฉํ์ฌ ์๋ฒ ์์์ ์๋ชจํ๋ ๊ณต๊ฒฉ
Experiments
Testbed Architecture

- ๊ณต๊ฒฉ ๋คํธ์ํฌ(Attack-Network) : ๋ค์ํ ๊ณต๊ฒฉ์ ์คํํ๋ ์์ ํ ๋ถ๋ฆฌ๋ ์ 3์ ์ธํ๋ผ
-
ํผํด ๋คํธ์ํฌ

- ๋ฐฉํ๋ฒฝ, ๋ผ์ฐํฐ, ์ค์์น, ๊ทธ๋ฆฌ๊ณ ๊ฐ PC์์ ์ ์ ํ์๋ฅผ ์ ๊ณตํ๋ ์์ด์ ํธ์ ํจ๊ป ์ฌ๋ฌ ์ผ๋ฐ์ ์ธ ์ด์์ฒด์ ๋ฅผ ๊ฐ์ถ ๊ณ ๋ณด์ ์ธํ๋ผ
- ํผํด ๋คํธ์ํฌ ๋ฉ์ธ ์ค์์น์ ํ ํฌํธ๋ ๋ฏธ๋ฌ ํฌํธ(mirror port)๋ก ์ค์ ๋์ด ๋คํธ์ํฌ๋ก ์ก์์ ๋๋ ๋ชจ๋ ํธ๋ํฝ์ ์์ ํ ์บก์ฒ
B-Profile
์ธ๊ฐ์ ์ํธ์์ฉ์์ ๋ํ๋๋ ์ถ์์ ์ธ ํ์ ํจํด์ ํ๋กํ์ผ๋ง ํ์ฌ ์ ์ ํธ๋ํฝ์ ์์ฑํ๋ ๋ฐฉ๋ฒ.
- HTTP, HTTPS, FTP, SSH, ์ด๋ฉ์ผ ํ๋กํ ์ฝ์ ๊ธฐ๋ฐ์ผ๋ก 25๋ช ์ฌ์ฉ์์ ์ถ์์ ํ์๋ฅผ ์ถ์ถ
- ML ๋ฐ ํต๊ณ ๋ถ์ ๊ธฐ์ ์ ์ฌ์ฉํ์ฌ ๋คํธ์ํฌ ์ด๋ฒคํธ๋ฅผ ์บก์ํ
- ํ๋กํ ์ฝ ๋ณ ํจํท ํฌ๊ธฐ ๋ถํฌ, ํ๋ก์ฐ ๋น ํจํท ์, ํ์ด๋ก๋์ ํน์ ํจํด, ํ์ด๋ก๋ ํฌ๊ธฐ, ๊ทธ๋ฆฌ๊ณ ํ๋กํ ์ฝ์ ์์ฒญ ์๊ฐ ๋ถํฌ ๋ฑ์ ์บก์ํ
- Java๋ก ๊ฐ๋ฐ๋ ์์ด์ ํธ๋ฅผ ๊ตฌ๋
- ํผํด ๋คํธ์ํฌ์์ 5๊ฐ์ง ํ๋กํ ์ฝ์ ๋ํด ์ ์ ํธ๋ํฝ์ ์๋ฎฌ๋ ์ด์
Attack Profiles

DataSet
Training Day : 1์ 12์ผ 10:30 ~ 17:15
Test Day : 3์ 11์ผ 09:40 ~ 17:35
Analysis
CICFlowMeter๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ์ ์์ 80๊ฐ์ ํธ๋ํฝ ํน์ง์ ์ถ์ถ.
๊ณต๊ฒฉ ๋ณ feature์ ๊ฐ์ค์น

RandomForestRegressor๋ฅผ ํตํด ์ค์๋๋ฅผ ๊ณ์ฐํ ํ, ๊ฐ ๊ณต๊ฒฉ ๋๋ ์ ์ ๋ณ๋ก ํด๋น ํน์ง์ด ๋ํ๋ด๋ ํ๊ท ๊ฐ๋ฅผ ๊ณฑํ์ฌ ๋ํ๋
-
RandomForestRegressor : Random Forest ๊ธฐ๋ฐ. ํน์ ์งํ๊ฐ ์ ๋ต์ ๋งํ๋ ๋ฐ ์ผ๋ง๋ ๊ธฐ์ฌํ๋ ์ง ๊ธฐ์ฌํ ์ ์์
๋์ ์๋ฆฌ
- ๋ฌด์์์ฑ ์ฃผ์ : Tree๋ฅผ ๋ง๋ค ๋, ๋ฐ์ดํฐ์ ํน์ง์ ๋ฌด์์๋ก ๊ณจ๋ผ ํ์ต
- ๋ถ์๋ ๊ฐ์ ์ธก์ : ํน์ ํน์ง์ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋๋์์ ๋ ๊ณต๊ฒฉ๊ณผ ์ ์์ด ์ผ๋ง๋ ๊นจ๋ํ๊ฒ ๊ฐ๋ผ์ง๋ ์ง ์ธก์ ํจ
- ์ ์ ๋งค๊ธฐ๊ธฐ : ๋ฐ์ดํฐ๋ฅผ ์ ๊ฐ๋ผ์น๊ฒ ๋ง๋๋ ํน์ง์ผ ์๋ก ๋์ ์ค์๋ ์ ์๋ฅผ ๋ถ์ฌ
Radviz ๋ค์ด์ด๊ทธ๋จ

Radviz๋ฅผ ํตํด N์ฐจ์ ๋ฐ์ดํฐ์ ์ ๋ชจ๋ ์ฐจ์์ ์ํฅ๋ ฅ๊ณผ ๊ด๋ จํ์ฌ ๊ฐ ์ฐจ์์ด ํํ๋๋ 2์ฐจ์ ๊ณต๊ฐ์ผ๋ก ํฌ์.
- Benign์์ ํจํท ๊ธธ์ด ํ์คํธ์ฐจ๊ฐ ๊ฐ์ฅ ์ํฅ๋ ฅ ์์. DDoS๋ ๋์ฒด๋ก ๊ณ ์ ๋๊ฑฐ๋ ์ ์ฌํ ํจํท์ ์์ฑํ๊ธฐ ๋๋ฌธ
- SYN์์ ACK Flag Count์ Flow Duration์ด ์ํฅ๋ ฅ ์์. ACK ์ฝ๋๋ก ์๋ฒ์ ์๋ตํ์ง ์๋ ๋ฐฉ์์ผ๋ก ์๋ํ๊ธฐ ๋๋ฌธ
- MSSQL์์ Protocol๊ณผ Fwd Packets/s์ด ์ํฅ๋ ฅ ์์. MC-SQLR์ ์ ์ฉํ์ฌ ํฌ์์์๊ฒ ์๋ฐฑ๋ง ๊ฐ์ ํจํท์ ๋ณด๋ด๊ธฐ ๋๋ฌธ
- IAT๊ฐ ์ํฅ๋ ฅ์ด ์์. DDoS๋ burstyํ๊ธฐ ๋๋ฌธ. burst ํจ์ด ๋๋ฌ๋ฅ ์ ์ํฅ์ ๋ฏธ์น๊ณ ๊ฒฐ๊ณผ์ ์ผ๋ก IAT ๊ด๋ จ ํน์ง์๋ ์ํฅ์ ์ค.
- TCP segment : ํฌ๊ธฐ๊ฐ ์ ์ฌํ๊ณ ์์ ์ ๋ง์ ์ ์ฑ ํจํท์ ๋ณด๋ด๋ ๊ฒฝํฅ์ด ์๊ธฐ ๋๋ฌธ์ ์ ์ฑ ํ๋ก์ฐ์ ์ต์ ์ธ๊ทธ๋จผํธ ํฌ๊ธฐ๋ ์ ์ ํ๋ก์ฐ์ ํจํท๋ณด๋ค ์์ ๊ฒ.
๋ถ์
ID3, Random Forest, Naive Bayes, ๋ก์ง์คํฑ ํ๊ท๋ผ๋ ๋ค ๊ฐ์ง ์ผ๋ฐ์ ์ธ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉ.
-
ID3 : ๊ฒฐ์ ํธ๋ฆฌ๋ฅผ ๋ง๋ค๊ธฐ ์ํด ์ต์ ์ ์์ฑ์ ์ฐพ๊ณ ์ ์ํธ๋กํผ(๋๋ ์ ๋ณด ์ด๋) ๊ฐ๋ . ์ํธ๋กํผ๋ ์งํฉ S์ ๋ถํ์ค์ฑ ์ ๋๋ฅผ ๋ํ๋ด๋ ์ฒ๋
\[โ\]- P(x)๋ ์งํฉ S ๋ด ์์์ ์์ ๋ํ ํด๋์ค x์ ์ํ ์์ ์์ ๋น์จ
- H(S) = 0์ ์งํฉ S์ ๋ชจ๋ ์์๊ฐ ๋์ผํ ๋ผ๋ฒจ์ ๊ฐ์ง๊ณ ์์์ ์๋ฏธ
์์ฑ A์ ์ํด ์งํฉ S๊ฐ ๋ถํ ๋๊ธฐ ์ ๊ณผ ํ์ ์ํธ๋กํผ ์ฐจ์ด๋ฅผ ์ธก์ ํ๊ธฐ ์ํด, ๋ค์ ๊ณต์์ผ๋ก ๊ณ์ฐ๋๋ ์ ๋ณด ์ด๋ I(S,A)๋ฅผ ์ฌ์ฉ
\[โ\]- H(t)๋ ํ์ ์งํฉ t์ ์ํธ๋กํผ
- Random forest : ๋ฌด์์๋ก ์ ํ๋ ๋ฐ์ดํฐ ์์ฑ์ ์
๋ ฅ๊ฐ์ผ๋ก ์ฌ์ฉํ๋ ๋ง์ ๊ฒฐ์ ํธ๋ฆฌ๋ค์ ํฌํจ
- ํฌ๋ ์คํธ๋ ๋ถ์ฐ์ด ์ ์ด๋ ํธ๋ฆฌ๋ค์ ์งํฉ์ผ๋ก, ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ ๋ค์๊ฒฐ ํฌํ๋ ๊ฐ์ค์น ํฌํ์ ์ํด ๊ฒฐ์ .
- ํฌ๋ ์คํธ ๋ด ํธ๋ฆฌ์ ์๊ฐ ์ฆ๊ฐํจ์ ๋ฐ๋ผ ํธํฅ์ ๊ทธ๋๋ก ์ ์ง๋๋ฉด์ ๋ชจ๋ธ์ ๋ถ์ฐ์ด ๊ฐ์. ๋งค๊ฐ๋ณ์ ์๊ฐ ์ ๊ณ ๊ณผ์ ํฉ์ ๋ํ ์ ํญ๋ ฅ์ด ์์
-
Naive Bayes : ํน์ง๋ค ์ฌ์ด์ ๊ฐ๋ ฅํ ๋ ๋ฆฝ์ฑ ๊ฐ์ ์ ๋ฐํ์ผ๋ก ํ ๋ฒ ์ด์ฆ ์ ๋ฆฌ ๊ธฐ๋ฐ์ ํ๋ฅ ์ ๋ถ๋ฅ๊ธฐ. ์ด์ฆ ์ ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ๋ถํด
\[โ\]- $X = (x1,โฆ,xn)$์ n๊ฐ์ ๋ ๋ฆฝ์ ์ธ ํน์ง ๋ฒกํฐ๋ฅผ ๋ํ๋ด๋ฉฐ $C_k$๋ ๊ฐ ํด๋์ค
- ํน์ง ๊ฐ์ ์๊ด๊ด๊ณ๊ฐ ์๋ค๊ณ ๊ฐ์ ์ ๋ฆฌ์ผ ์๋์์ ๋ง์ง ์์ ์ ํ๋์ ๋ฌธ์ ๊ฐ ์์
- ์จ๋ผ์ธ ์๊ณ ๋ฆฌ์ฆ์ด๋ฉฐ ์ ํ ์๊ฐ ๋ด์ ํ์ต์ ์๋ฃ
- ๋คํญ ๋ก์ง์คํฑ ํ๊ท(Multinomial Logistic Regression) : ๋ก์ง์คํฑ ํ๊ท์ ์ฃผ์ ์์ด๋์ด๋ฅผ ์ฌ์ฉํ์ฌ ๋ค์ค ํด๋์ค ๋ฌธ์ ๋ฅผ ๋ถ๋ฅํ๋ ๋ฐฉ๋ฒ.
- ์์ธก ๋ถ์์ ์ผ์ข
- ๋ก์ง์คํฑ ํ๊ท๋ ๋ฐ์ดํฐ๋ฅผ ์ค๋ช ํ๊ณ ํน์ง๊ณผ ํด๋์ค ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ค๋ช

Five-fold cross validation ์ฌ์ฉ
- Five-fold cross validation : ๋ฐ์ดํฐ์ ์ 5๊ฐ๋ก ๋๋์ด, 4๊ฐ๋ก ํ์ตํ๊ณ 1๊ฐ๋ก ๊ฒ์ฌํ๋ ๊ณผ์ ์ 5๋ฒ ๋ฐ๋ณตํ๋ ๋ฐฉ์
ID3๋ ํ์ต ๋ฐ ํ ์คํธ ์ธํธ ๋ถ๋ฅ์ ๋ช ๋ถ๋ฐ์ ๊ฑธ๋ฆฌ์ง ์์์ง๋ง, 100๊ฐ์ ํธ๋ฆฌ๋ฅผ ๊ฐ์ง RF๋ 15์๊ฐ ์ด์์ด ์์ ๋๊ณ ๋คํญ ๋ก์ง์คํฑ ํ๊ท๋ 2์ผ ์ด์์ด ์์
Contribution
-
๊ธฐ์กด ๋ฐ์ดํฐ์ ์ ๋ถ์ํ์ฌ ์ฃผ์ ๋จ์ ๊ณผ ํ๊ณ๋ฅผ ์ฐพ์ ์๋ก์ด ๋ฐ์ดํฐ์ ์ ์์ฑ
์ด์ ๋ฐ์ดํฐ์ ์ ๋จ์ ๊ณผ ํ๊ณ๋ฅผ ๋ณด์ํ๋ CICDDoS2019๋ผ๋ ์๋ก์ด DDoS ๋ฐ์ดํฐ์ ์ ์์ฑํ๊ธฐ ์ํ ์ ๊ทผ ๋ฐฉ์์ ์ ์
-
๋ณธ ๋ ผ๋ฌธ์ ์์ฑ๋ ๋ฐ์ดํฐ์ ์ ๋ถ์ํ์ฌ ๋ฐ์ฌํ DDoS(DNS, LDAP, MSSQL, TFTP ๋ฑ), UDP, UDP-Lag ๋ฐ SYN์ ํฌํจํ ๋ค์ํ ์ ํ์ DDoS ๊ณต๊ฒฉ์ ํ์งํ๊ธฐ ์ํ ์ต์ ์ ํน์ง ์ธํธ๋ฅผ ์ ์
ID3, ๋๋ค ํฌ๋ ์คํธ, ๋์ด๋ธ ๋ฒ ์ด์ฆ, ๋ก์ง์คํฑ ํ๊ท ๋ฑ ๋ค ๊ฐ์ง ์ผ๋ฐ์ ์ธ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ํ์ต์ํด์ผ๋ก์จ ํจํด์ ์บก์ฒํ๋ ๋ชจ๋ธ์ ๊ตฌ์ถ
Leave a comment