μ•Œμ•„μ•Ό ν•  졜고의 빅데이터 κΈ°μˆ λ“€

λΉ…λ°μ΄ν„°λž€ 무엇인가?”에 λŒ€ν•œ 지식을 이어가면, 이 κΈ°μ‚¬λŠ” 기업이 μ‚¬μš©ν•  수 μžˆλŠ” μ£Όμš” 빅데이터 기술 쀑 일뢀λ₯Ό κ³΅κ°œν•  κ²ƒμž…λ‹ˆλ‹€. μ „ μ„Έκ³„μ μœΌλ‘œ μƒμ„±λ˜κ³  μˆ˜μ§‘λ˜κ³  μ‚¬μš©λ˜λŠ” 데이터 양은 2024년에 149 μ œνƒ€λ°”μ΄νŠΈμ— 달할 κ²ƒμœΌλ‘œ μ˜ˆμΈ‘λ©λ‹ˆλ‹€. 기업이 μ΄λŸ¬ν•œ 데이터λ₯Ό μ €μž₯ν•˜κ³  μ²˜λ¦¬ν•˜κ³  λΆ„μ„ν•˜κΈ° μœ„ν•΄μ„œλŠ” 빅데이터 기술이 ν•„μš”ν•©λ‹ˆλ‹€.

I. 빅데이터 κΈ°μˆ μ΄λž€?

빅데이터 κΈ°μˆ μ€ λŒ€κ·œλͺ¨ 데이터 μ§‘ν•©μ—μ„œ 정보λ₯Ό λΆ„μ„ν•˜κ³  μ²˜λ¦¬ν•˜κ³  μΆ”μΆœν•˜κΈ° μœ„ν•΄ μ„€κ³„λœ μ†Œν”„νŠΈμ›¨μ–΄ μœ ν‹Έλ¦¬ν‹°μž…λ‹ˆλ‹€. 보톡 μ΄λŸ¬ν•œ λ°μ΄ν„°λŠ” 맀우 큰 규λͺ¨μ™€ 맀우 λ³΅μž‘ν•œ ꡬ쑰λ₯Ό 가지고 μžˆμ–΄ 전톡적인 기술둜 μ²˜λ¦¬ν•  수 μ—†μŠ΅λ‹ˆλ‹€.

II. 빅데이터 기술의 λΆ„λ₯˜ 데이터 μ €μž₯

이 μœ ν˜•μ˜ 빅데이터 κΈ°μˆ μ€ 데이터λ₯Ό κ°€μ Έμ˜€κ³  μ €μž₯ν•˜κ³  관리할 수 μžˆλŠ” 인프라λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ μ†Œν”„νŠΈμ›¨μ–΄ ν”„λ‘œκ·Έλž¨μ΄ 데이터λ₯Ό μ‰½κ²Œ μ ‘κ·Όν•˜κ³  μ‚¬μš©ν•˜κ³  λΉ λ₯΄κ²Œ μ²˜λ¦¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

CΓ΄ng nghệ Big Data

Big Data technology is divided into four main types – Image: analytixlabs.com

데이터 λ§ˆμ΄λ‹

데이터 λ§ˆμ΄λ‹μ€ μ›μ‹œ λ°μ΄ν„°μ—μ„œ μœ μš©ν•œ 정보λ₯Ό μΆ”μΆœν•˜κ³  λΆ„μ„ν•˜λŠ” κ³Όμ •μž…λ‹ˆλ‹€. 일반적으둜 μ΄λŸ¬ν•œ λ°μ΄ν„°λŠ” 규λͺ¨κ°€ 크고 변동성이 λ†’μœΌλ©° 맀우 λΉ λ₯Έ μ†λ„λ‘œ νλ¦…λ‹ˆλ‹€. λ”°λΌμ„œ νŠΉλ³„ν•œ 기술 μ—†μ΄λŠ” 데이터 μΆ”μΆœμ΄ 거의 λΆˆκ°€λŠ₯ν•©λ‹ˆλ‹€.

κ΄€λ ¨ 기사

빅데이터와 ν΄λΌμš°λ“œ μ»΄ν“¨νŒ…: μ™„λ²½ν•œ μ‘°ν•©
빅데이터와 ν΄λΌμš°λ“œ μ»΄ν“¨νŒ…: μ™„λ²½ν•œ μ‘°ν•©

졜근 λͺ‡ λ…„κ°„ 빅데이터와 ν΄λΌμš°λ“œ μ»΄ν“¨νŒ…μ΄ IT μ‚°μ—…μ˜ νŠΈλ Œλ“œλ₯Ό νŒŒμ•…ν•˜λŠ” 데 μ€‘μš”ν•œ 기술둜 λ“±μž₯ν–ˆμŠ΅λ‹ˆλ‹€. 각 κΈ°μˆ λ§ˆλ‹€ μž₯단점이 μžˆμ§€λ§Œ, λ§Žμ€ λΉ„μ¦ˆλ‹ˆ...

데이터 뢄석

데이터 λΆ„μ„μ—μ„œλŠ” κΈ°μˆ μ„ μ‚¬μš©ν•˜μ—¬ 데이터λ₯Ό μ •λ¦¬ν•˜κ³  λ³€ν™˜ν•˜μ—¬ λΉ„μ¦ˆλ‹ˆμŠ€ μ˜μ‚¬ 결정을 지원할 κ°€μΉ˜ μžˆλŠ” μ •λ³΄λ‘œ λ§Œλ“­λ‹ˆλ‹€. 빅데이터 뢄석 도ꡬλ₯Ό μ‚¬μš©ν•˜λ©΄ 고객 μ„ ν˜Έλ„μ™€ μ‹œμž₯ νŠΈλ Œλ“œμ— λŒ€ν•œ 톡찰λ ₯을 μ œκ³΅ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

데이터 μ‹œκ°ν™”

데이터 μ‹œκ°ν™” κΈ°μˆ μ€ κ·Έλž˜ν”„, 차트 및 지도와 같은 μ‹œκ°μ  μš”μ†Œλ₯Ό μ‚¬μš©ν•˜μ—¬ λ°μ΄ν„°μ˜ νŠΈλ Œλ“œ, νŒ¨ν„΄ 및 μ΄μƒμΉ˜λ₯Ό μ„€λͺ…ν•©λ‹ˆλ‹€. 데이터가 μ²˜λ¦¬λ˜μ–΄ λŒ€κ·œλͺ¨ 정보λ₯Ό λͺ‡ 초 λ§Œμ— νŒŒμ•…ν•  수 μžˆλŠ” κ·Έλž˜ν”½ ν‘œν˜„μ„ λ§Œλ“­λ‹ˆλ‹€.

Data Visualization

Data visualization is the visual presentation of data or information – Image: venngage.com

III. 졜고의 빅데이터 기술

1. μ•„νŒŒμΉ˜ ν•˜λ‘‘

μ•„νŒŒμΉ˜λŠ” 데이터 μ €μž₯ 기술 범주에 μ†ν•©λ‹ˆλ‹€. MapReduce ν”„λ‘œκ·Έλž˜λ° λͺ¨λΈμ„ μ‚¬μš©ν•˜μ—¬ λŒ€μš©λŸ‰ 데이터λ₯Ό μ €μž₯ν•˜κ³  μ²˜λ¦¬ν•˜κΈ° μœ„ν•œ μ˜€ν”ˆ μ†ŒμŠ€ μ†Œν”„νŠΈμ›¨μ–΄ ν”Œλž«νΌμž…λ‹ˆλ‹€. 이 κΈ°μˆ μ€ λͺ¨λ“  데이터 ν˜•μ‹μ„ μ²˜λ¦¬ν•  수 μžˆλŠ” μœ μ—°μ„±κ³Ό ν™•μž₯성을 κ°–μΆ”κ³  있으며 μž₯μ• μ—μ„œ 볡ꡬ할 수 μžˆμŠ΅λ‹ˆλ‹€. μ•„νŒŒμΉ˜ ν•˜λ‘‘μ€ κ°€μž₯ 널리 μ‚¬μš©λ˜λŠ” 빅데이터 μ—”μ§„μž…λ‹ˆλ‹€.

κ΄€λ ¨ 기사

μ‹€μƒν™œμ—μ„œ λΉ… 데이터가 κ°€μ Έμ˜€λŠ” μƒμœ„ 10가지 μ‘μš© ν”„λ‘œκ·Έλž¨
μ‹€μƒν™œμ—μ„œ λΉ… 데이터가 κ°€μ Έμ˜€λŠ” μƒμœ„ 10가지 μ‘μš© ν”„λ‘œκ·Έλž¨

μ§€λ‚œ μ‹­λ…„ λ™μ•ˆ, λΉ… λ°μ΄ν„°μ˜ μ‚¬μš©μ€ μ†ŒλΉ„μžμ˜ 일상 μƒν™œκ³Ό μ‡Όν•‘ μŠ΅κ΄€μ˜ 거의 λͺ¨λ“  츑면에 영ν–₯을 λ―ΈμΉ  μ •λ„λ‘œ μ„±μž₯ν–ˆμŠ΅λ‹ˆλ‹€. ν•˜μ§€λ§Œ λ§Žμ€ μ‚¬λžŒλ“€μ΄ 지...

2. ν”„λ ˆμŠ€ν† 

ν”„λ ˆμŠ€ν† λŠ” 데이터 λ§ˆμ΄λ‹ 기술 λ²”μ£Όμ˜ λŒ€ν‘œμž…λ‹ˆλ‹€.

Facebookμ—μ„œ 개발된 ν”„λ ˆμŠ€ν† λŠ” λŒ€κ·œλͺ¨ λ°μ΄ν„°μ˜ SQL 쿼리 뢄석을 ν—ˆμš©ν•˜λŠ” μ˜€ν”ˆ μ†ŒμŠ€ SQL 쿼리 μ—”μ§„μž…λ‹ˆλ‹€. 이 κΈ°μˆ μ€ 데이터λ₯Ό λ³„λ„μ˜ 뢄석 μ‹œμŠ€ν…œμœΌλ‘œ μ΄λ™μ‹œν‚€μ§€ μ•Šκ³  데이터가 μžˆλŠ” μœ„μΉ˜λ₯Ό 쿼리할 수 μžˆμŠ΅λ‹ˆλ‹€. 특히 ν”„λ ˆμŠ€ν† μ—μ„œμ˜ 단일 μΏΌλ¦¬λŠ” 쑰직 λ‚΄μ—μ„œ μ—¬λŸ¬ μ†ŒμŠ€μ—μ„œ 데이터λ₯Ό κ²°ν•©ν•˜κ³  λͺ‡ λΆ„ 내에 뢄석을 μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

prestodb.io

Presto technology brings many great benefits – Image: github.com

3. μ•„νŒŒμΉ˜ 슀파크

μ•„νŒŒμΉ˜ μŠ€νŒŒν¬λŠ” 데이터 뢄석 κΈ°μˆ μ—μ„œ λ‘λ“œλŸ¬μ§„ μ΄λ¦„μž…λ‹ˆλ‹€. μ• ν”Œλ¦¬μΌ€μ΄μ…˜ μ‹€ν–‰ μ‹œ λΉ λ₯΄κ³  효율적이기 λ•Œλ¬Έμ— 데이터 뢄석에 λŒ€ν•œ 인기 μžˆλŠ” 빅데이터 κΈ°μˆ μž…λ‹ˆλ‹€.

μŠ€νŒŒν¬μ—λŠ” SQL, 기계 ν•™μŠ΅, κ·Έλž˜ν”„ 처리 및 슀트림 뢄석을 μœ„ν•œ λ‚΄μž₯ κΈ°λŠ₯이 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, λΉ„μ¦ˆλ‹ˆμŠ€ κΈ°μ—…μ˜ μš”κ΅¬μ— 따라 ν•˜λ‘‘κ³Ό μ‰½κ²Œ ν†΅ν•©λ˜μ–΄ λΉ λ₯Έ μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

κ΄€λ ¨ 기사

λΉ… 데이터 λΆ„μ„μ΄λž€ λ¬΄μ—‡μΈκ°€μš”? μ™œ μ€‘μš”ν•œκ°€μš”?
λΉ… 데이터 λΆ„μ„μ΄λž€ λ¬΄μ—‡μΈκ°€μš”? μ™œ μ€‘μš”ν•œκ°€μš”?

λΉ… λ°μ΄ν„°λŠ” μ˜€λŠ˜λ‚  IT μ‚°μ—…μ—μ„œ κ°€μž₯ 인기 μžˆλŠ” 단어 쀑 ν•˜λ‚˜μž…λ‹ˆλ‹€. 디지털 μ‹œλŒ€μ—λŠ” λΉ… 데이터가 기업이 μ†Œμœ ν•  수 μžˆλŠ” 큰 μžμ‚°μž…λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ 이 λ...

4. μΉ΄ν”„μΉ΄

μ•„νŒŒμΉ˜ 슀파크 외에도, μΉ΄ν”„μΉ΄λŠ” 데이터 뢄석 λ²”μ£Όμ˜ 빅데이터 κΈ°μˆ μž…λ‹ˆλ‹€. μΉ΄ν”„μΉ΄λŠ” λŒ€κ·œλͺ¨λ‘œ 슀트리밍 데이터λ₯Ό μˆ˜μ§‘, μ €μž₯, 읽고 λΆ„μ„ν•˜κΈ° μœ„ν•œ μ‹œμŠ€ν…œμž…λ‹ˆλ‹€.

μ‹€μ‹œκ°„ 온라인 데이터 뢄석을 μœ„ν•΄ μΉ΄ν”„μΉ΄λŠ” μ•„νŒŒμΉ˜ μŠ€νŒŒν¬μ™€ μ›ν™œν•˜κ²Œ 톡합될 수 μžˆμŠ΅λ‹ˆλ‹€. 이 ν”Œλž«νΌμ€ νŠΈμœ„ν„°, μŠ€ν¬ν‹°νŒŒμ΄, λ„·ν”Œλ¦­μŠ€, λ§ν¬λ“œμΈμ„ ν¬ν•¨ν•œ 수천 개의 μ‘°μ§μ—μ„œ μ‚¬μš©λ©λ‹ˆλ‹€. μΉ΄ν”„μΉ΄μ˜ μœ μΌν•œ 단점은 쒋은 λͺ¨λ‹ˆν„°λ§ μ†”λ£¨μ…˜μ΄ λΆ€μ‘±ν•˜λ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€.

kafka big data

Kafka is a real-time online data analytics technology – Image: developers.redhat.comΒ 

5. Tableau

TableauλŠ” 데이터 μ‹œκ°ν™” κΈ°μˆ μ— μ†ν•©λ‹ˆλ‹€. μ‚¬μš©μžκ°€ λ‹€μ–‘ν•œ μ’…λ₯˜μ˜ μ°¨νŠΈμ™€ λŒ€μ‹œλ³΄λ“œλ₯Ό λ§Œλ“€μ–΄ 데이터 μ‹œκ°ν™” 및 뢄석을 μ‰½κ²Œ ν•  수 μžˆμŠ΅λ‹ˆλ‹€. Tableauλ₯Ό μ‚¬μš©ν•˜λ©΄ μ‚¬μš©μžλ“€μ€ μ‹€μ‹œκ°„ 데이터 μ„ΈνŠΈμ—μ„œ μž‘μ—…ν•˜μ—¬ κ°€μΉ˜ μžˆλŠ” 정보λ₯Ό μ–»κ³  μ˜μ‚¬ 결정을 κ°œμ„ ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 이λ₯Ό 톡해 λΉ„μ¦ˆλ‹ˆμŠ€ κ°œλ°œμ„ μ΄‰μ§„ν•˜λŠ” 데 도움이 λ©λ‹ˆλ‹€.

κ²°λ‘ 

λ§ˆμ§€λ§‰μœΌλ‘œ, λΉ…λ°μ΄ν„°λŠ” μ—¬μ „νžˆ λ§Žμ€ κΈ°μ‘΄ 빅데이터 기술의 μ‘μš© ν”„λ‘œκ·Έλž¨μœΌλ‘œ λ°œμ „ μ€‘μž…λ‹ˆλ‹€. μœ„μ—μ„œ μ–ΈκΈ‰λœ 인기 μžˆλŠ” 기술 외에도, AI, NoSQL λ˜λŠ” 블둝체인 등이 μ£Όμš” 이름 쀑 ν•˜λ‚˜μž…λ‹ˆλ‹€. λΉ„μ¦ˆλ‹ˆμŠ€μ—μ„œ 빅데이터 κΈ°μˆ μ„ κ΅¬ν˜„ν•˜λ©΄ λ§Žμ€ 이점을 얻을 수 μžˆμŠ΅λ‹ˆλ‹€. μ‹œμž₯μ—μ„œ μ œκ³΅λ˜λŠ” κΈ°μˆ μ„ μ΅œλŒ€ν•œ ν™œμš©ν•˜λ €λ©΄ 기업이 μ§λ©΄ν•œ 문제의 μœ ν˜•μ„ νŒŒμ•…ν•΄μ•Ό ν•©λ‹ˆλ‹€. 이것이 졜적의 해결책을 μ„ νƒν•˜λŠ” 데 도움이 될 κ²ƒμž…λ‹ˆλ‹€.