Skip to content

๐Ÿš– TLC ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•œ ํƒ์‹œ์š”๊ธˆ ์˜ˆ์ธก ์‹ค์‹œ๊ฐ„ ํŒŒ์ดํ”„๋ผ์ธ

Notifications You must be signed in to change notification settings

yello-ow/TLC_stream

Folders and files

NameName
Last commit message
Last commit date

Latest commit

ย 

History

5 Commits
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 
ย 

Repository files navigation

Kafka, Flink๋ฅผ ์ด์šฉํ•œ ํƒ์‹œ์š”๊ธˆ ์˜ˆ์ธก Project

ํƒ์‹œ์š”๊ธˆ ์˜ˆ์ธก์„ ์œ„ํ•œ ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ์ŠคํŠธ๋ฆผ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ•



โš’ ๊ธฐ์ˆ  ์Šคํƒ

Python pandas sckit_learn Kafka Flink Docker

ํ”„๋กœ์ ํŠธ ๊ฐœ์š”

  • ๐Ÿ“… ํ”„๋กœ์ ํŠธ ๊ธฐ๊ฐ„: 2022.04.18 - 2022.04.29

ํ”„๋กœ์ ํŠธ ๋ชฉํ‘œ

  • ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ์—์„œ์˜ ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ตฌ์ถ•
  • TLC ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•ด ํƒ์‹œ์š”๊ธˆ ์˜ˆ์ธก ML ๋ชจ๋ธ๋ง
  • ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ์ŠคํŠธ๋ฆผ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ•

๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ


ํ”„๋กœ์ ํŠธ ๊ณผ์ •

  • Pandas๋ฅผ ์ด์šฉํ•ด ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ
  • scikit-learn์„ ์ด์šฉํ•ด ์ „์ฒ˜๋ฆฌ ์™„๋ฃŒ๋œ ๋ฐ์ดํ„ฐ๋กœ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ํ•™์Šต
  • Kafka Producer๋ฅผ ์ด์šฉํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ „์†ก
  • Kafka์—์„œ ์ „์†ก๋ฐ›์€ ๋ฐ์ดํ„ฐ๋ฅผ Flink๋ฅผ ์ด์šฉํ•ด ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์— ๋„ฃ๊ณ  ์‹ค์‹œ๊ฐ„์œผ๋กœ ์˜ˆ์ธก๊ฐ’ ์ถœ๋ ฅ

ํ”„๋กœ์ ํŠธ ํšŒ๊ณ 

  • ์ด๋ฒˆ ํ”„๋กœ์ ํŠธ๋Š” ์‚ฌ์‹ค ์ด์ „์— spark์™€ airflow๋ฅผ ์ด์šฉํ•œ ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ ํ”„๋กœ์ ํŠธ๋ฅผ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด ์‹œ์ž‘ํ•œ ํ”„๋กœ์ ํŠธ์˜€๋Š”๋ฐ ์—ฌ์ „ํžˆ spark์—์„œ ํ•™์Šตํ•œ ๋ชจ๋ธ์„ flink์—์„œ ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ์— ์ ์šฉํ•˜๋Š”๋ฐ ์–ด๋ ค์›€์„ ๋Š๊ปด spark, airflow, kafka, flink ๋ชจ๋‘๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์€ ํฌ๊ธฐํ•˜๊ณ  ์ด์ „์— ์‚ฌ์šฉํ•ด๋ณด์ง€ ์•Š์€ kafka, flink ์œ„์ฃผ์˜ ํ”„๋กœ์ ํŠธ๋ฅผ ์ง„ํ–‰ํ–ˆ๋‹ค.
  • spark sql๊ณผ spark mllib ๋Œ€์‹  ์ต์ˆ™ํ•œ pandas์™€ scikit-learn์„ ์ด์šฉํ–ˆ์ง€๋งŒ flink์—์„œ ๋ณต์žกํ•œ ๋ชจ๋ธ์€ ์‚ฌ์šฉํ•  ์ˆ˜๊ฐ€ ์—†์–ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์ด ์ข‹์ง€ ๋ชปํ•œ ์ ์€ ๋งค์šฐ ์•„์‰ฝ๋‹ค. ํ•˜์ง€๋งŒ ์ด๋ฒˆ ํ”„๋กœ์ ํŠธ์˜ ๋ชฉ์ ์ด ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ์ŠคํŠธ๋ฆผ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ•์ธ ๋งŒํผ ๋‚˜๋ฆ„ ํŒŒ์ดํ”„๋ผ์ธ ๋‹จ๊ณ„ ๊ตฌ์„ฑ์€ ๋‚˜์˜์ง€ ์•Š๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค.
  • ํŒŒ์ดํ”„๋ผ์ธ์—๋Š” flink์—์„œ ์˜ˆ์ธกํ•œ ๊ฒฐ๊ณผ๊ฐ’์„ ์ €์žฅํ•œ๋‹ค๊ณ  ๋˜์–ด์žˆ์ง€๋งŒ ๋Œ€์šฉ๋Ÿ‰ data๊ฐ€ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋“ค์–ด์˜ค๊ธฐ ๋–„๋ฌธ์— ๋น„์šฉ, ์šฉ๋Ÿ‰ ๋ฌธ์ œ๋กœ ํด๋ผ์šฐ๋“œ๋‚˜ local ํ™˜๊ฒฝ์— ์ €์žฅ ํ•  ์ˆ˜ ์—†์—ˆ๋‹ค. ์‹ค์ œ ์—…๋ฌด์—์„œ๋Š” ์˜ˆ์ธกํ•œ ๊ฒฐ๊ณผ๊ฐ’์œผ๋กœ ์„œ๋น„์Šค๋ฅผ ์ œ๊ณตํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ด ๋ถ€๋ถ„์€ ์‹ค์ œ ์—…๋ฌด์— ์ ์šฉ๋œ๋‹ค๋ฉด ๋ณด์™„ ๊ฐ€๋Šฅํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค.
  • ์ถ”ํ›„์—๋Š” spark, airflow, kafka, flink๋ฅผ ๋ชจ๋‘ ์‚ฌ์šฉํ•˜๋Š” ํ”„๋กœ์ ํŠธ๋ฅผ ์™„๋ฒฝํ•˜๊ฒŒ ์™„์„ฑํ•ด๋ณด๊ณ  ์‹ถ๋‹ค๋Š” ์š•์‹ฌ์ด ๋“ ๋‹ค.

About

๐Ÿš– TLC ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•œ ํƒ์‹œ์š”๊ธˆ ์˜ˆ์ธก ์‹ค์‹œ๊ฐ„ ํŒŒ์ดํ”„๋ผ์ธ

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages