반응형
데이터베이스(database, DB)는 여러 사람이 공유하여 사용할 목적으로 체계화해 통합, 관리하는 데이터의 집합이다. 작성된 목록으로써 여러 응용 시스템들의 통합된 정보들을 저장하여 운영할 수 있는 공용 데이터들의 묶음이다. (출처 : 위키백과)
DBMS (Database Management System) : DB를 만들고 운영하는데 필요한 소프트웨어, DB와 사용자 사이 명령을 전달하고 데이터를 꺼내오는 일을 돕는다.
SQL : RDB와 소통하기 위한 언어
쿼리 : DB에 무언가를 요청하는 행위
DB의 형태는 크게 두 가지임
관계형 데이터베이스(RDB, Relational Database) | 관계형 데이터베이스가 아닌 Non-RDB (=NoSQL) |
엑셀의 형태와 비슷함. 회사에서 다루는 대부분의 DB | |
일관성, 안정적 | 유연함, 빠름 |
결제, 유저, 주문, 상품 | 앱/웹로그, 무선신호, 채팅 |
상호보완적으로 함께 쓰임 | |
ORACLE (유료) MYSQL, PostgreSQL (오픈소스) |
NoSQL, mongoDB |
관계형 데이터베이스(RDB, Relational Database)
· Primary Key = PK = Key Value = 키값
· ERD : DB에 있는 데이터들을 한눈에 볼 수 있게 펼쳐놓은 그림
· 테이블 스키마 : 테이블에 대해 담긴 정보, 데이터 타입 확인 가능
데이터 타입도 어떤 DBMS냐에 따라서 구분이 다를 수 있다.
데이터 타입 in SQL
문자 | 숫자 | 날짜와 시간 |
char string |
Numeric int, float |
date, time datetime, timestamp* |
구분 | Tool | 활용 |
데이터 분석 자유도(1) | 엑셀 | 간단한 데이터 분석 분석 결과 커뮤니케이션용 로우 데이터 전달 처리량에 한계(20년 기준 약 1백만 개) |
데이터 분석 자유도(2) | SQL | 데이터 추출 및 전처리 비즈니스 분석 |
데이터 분석 자유도(3) | R | 통계학자들로부터 유래 통계분석 기능과 생태계 풍부 시각화에 뛰어난 ggplot |
Python | 프로그래밍 언어이지만, 데이터 분석에 강점이 있다. 분석과 개발의 협업이 필요한 경우 주로 사용 |
|
BI Tool | Spotfire, Tableau, Looker, Redash, Data Studio, Metabase 등 | 데이터 시각화 및 대시보드 제작을 통해 전사 데이터 공유 간단한 분석도 코딩없이 클릭으로 가능 |
특정산업 또는 목적 | SAS, SPSS, GIS 등 | 금융, 리서치, 모빌리티 산업군 등 특정 산업에 활용 |
TensorFlow, Pytorch | 딥러닝 프레임워크 |
주요 업무 과정
: SQL로 DB 데이터 수집 -> R 또는 Python으로 모델링 및 분석 -> B.I, 엑셀, PPT 등으로 결과 공유
반응형
'RDB' 카테고리의 다른 글
MySQL] Group By 이후 SUM (0) | 2023.06.15 |
---|---|
MySQL] 유용한 문법 정리(추가) (0) | 2023.06.09 |
MySQL 백업 및 복원 (0) | 2023.06.09 |
MySQL : 조인(JOIN) (0) | 2021.11.11 |
MySQL 입문 (0) | 2021.11.11 |