본문 바로가기
반응형

전체 글74

Exploratory Data Analysis with Python 탐색적 데이터 분석(EDA)은 데이터 세트를 분석하고 이해하기 위한 접근 방식입니다. 이는 데이터 분석 프로세스에서 중요한 단계입니다. 통찰력을 얻고 추가 ​​분석 및 모델링을 알릴 수 있는 데이터의 패턴을 식별할 수 있기 때문입니다. 광범위한 강력한 라이브러리를 갖춘 Python은 탐색적 데이터 분석을 위한 이상적인 선택입니다. 이 기사에서는 EDA용 Python의 인기 있는 라이브러리를 탐색하고 이를 사용하여 데이터에서 통찰력을 얻는 방법을 보여줍니다. Getting Started Python을 사용한 EDA의 세부 사항을 살펴보기 전에 먼저 EDA가 무엇이고 왜 중요한지 논의해 보겠습니다. EDA는 탐색과 발견을 강조하는 데이터 분석 접근 방식입니다. 데이터를 더 잘 이해한다는 목표를 가지고 시각화.. 2023. 1. 24.
Creating Interactive Visualizations with Python 데이터 시각화는 복잡한 데이터 세트를 이해하고 전달하기 위한 강력한 도구입니다. 그러나 정적 시각화는 데이터 탐색 및 분석 여정에서 지금까지만 사용할 수 있습니다. 대화형 시각화를 통해 데이터 포인트를 확대/축소, 패닝 및 마우스로 가리킬 수 있는 기능을 제공하여 정적 플롯을 넘어 데이터를 더 깊이 파고들 수 있습니다. 광범위하고 강력한 라이브러리가 있는 Python은 대화형 시각화를 만드는 데 이상적인 선택입니다. 이 기사에서는 대화형 시각화를 만들기 위해 Python에서 인기 있는 몇 가지 라이브러리를 살펴봅니다. Getting Started 대화형 시각화 만들기에 들어가기 전에 먼저 대화형 시각화가 중요한 이유에 대해 논의해 보겠습니다. 대화형 시각화를 통해 보다 자연스러운 방식으로 데이터를 탐색할.. 2023. 1. 24.
Data Visualization 101 with Python 데이터 시각화는 복잡한 데이터 세트를 이해하고 전달하기 위한 강력한 도구입니다. 이를 통해 원시 데이터에서 즉시 명확하지 않을 수 있는 패턴과 추세를 탐색하고 결과를 명확하고 설득력 있는 방식으로 전달할 수 있습니다. Python은 광범위한 강력한 라이브러리와 사용하기 쉬운 구문 덕분에 데이터 시각화를 위한 가장 인기 있는 프로그래밍 언어 중 하나입니다. 이 기사에서는 Python을 사용한 데이터 시각화의 기본 사항을 소개하고 첫 번째 시각화를 만드는 방법을 보여줍니다. Getting Started Python을 사용한 데이터 시각화의 세부 사항을 살펴보기 전에 먼저 데이터 시각화가 무엇이고 왜 중요한지 논의해 보겠습니다. 데이터 시각화는 정보를 탐색하고 전달하기 위해 데이터를 그래픽으로 표현하는 프로세.. 2023. 1. 24.
[Spotfire/중급] Join (왼쪽 외부, 완전 외부, 내부 조인) JOIN 2개의 Data Table을 Key값이 되어주는 변수들을 통해 연결시켜 주는 것을 Join이라고 합니다. (Excel에서는 보통 vlookup으로 대체되서 많이 사용) 일반적으로 왼쪽/오른쪽 내부/외부 조인이라고 불리우며, 사실 왼쪽 오른쪽은 큰 의미는 없습니다. 1) 기준이 되는 Table이 있는 위치를 생각하시면 왼쪽/오른쪽 Join을 생각하실 때 편할 것이라 생각이 듭니다. 2) 내부/외부는 기준이 되는 Table은 보존이되고 연결되어 붙여지는 Table에 기준점이 되는 key값의 value가 없을 때 Null 값이 생성되는가(외부) 아니면 그 행을 지우는가(내부)로 이름이 붙여진다고 생각하시면 됩니다. 밑에 그림을 보시면 직관적으로 이해하기 편하실거라 생각합니다. ① ② ③ Spotfir.. 2022. 11. 9.
[Spotfire/중급] Rank 함수 (Rank, DenseRank) Rank Function 순위 함수는 선택한 컬럼에 대해서 순위를 반환하는 함수 입니다. 가장 많이 쓰이는 순위 함수는 Rank와 DenseRank 2가지가 있습니다. 1. Rank 함수 필수 Parameter 1개와 선택적 Parameter 3개로 총 4개의 Parameter를 Setting 할 수 있다. ① 필수 Parameter 1) 순위를 부여하고자 하는 변수 ② 선택적 Parameter 1) 오름차순(asc) or 내림차순(desc) 2) Group별로 순위를 지정하고 싶을 때 Group을 나눠줄 변수 3) 순위가 동점인 value는 어떻게 처리할지 Rank([순위를부여하고자하는변수], "오름/내림차순", [Group지을변수], "ties.method=(동점일때)") (동점일때) = minimu.. 2022. 11. 9.
[Spotfire/초급] 논리 Text Function Logical Function 논리 함수는 특정 조건을 주고 해당 조건이 참 or 거짓에 따라 반환하는 값을 다르게 설정할 수 있게 하는 함수입니다. 대표적으로 If, Case가 있습니다. ① If # If if(3 > 1, "참", "거짓") # 참 반환 ② Case # Case Case when [Column1] > 1 then "참1" when [Column1] = 0 then "참2" else "" end # [Column1] 에 있는 값이 1보다 크면 참1을 반환 # 0 이면 참2를 반환 # 나머지는 "" 값을 반환 2022. 11. 8.
[Spotfire/초급] 텍스트 함수 Text Function 텍스트 함수는 문자열을 가공하는 함수 입니다. # Left 함수 : 문자열 내에서 왼쪽부터 주어진 숫자만큼 반환 Left("Company", 2) # Co # Company를 입력한 위치에 [Column] 기입 # Right 함수 : 문자열 내에서 오른쪽부터 주어진 숫자만큼 반환 Right("Company", 2) # ny # Len 함수 : 문자열의 길이 반환 Len("Company") # 7 # Find 함수 : 문자열 내에서 주어진 문자를 찾아서 위치를 반환 Find("p", "Company") # 4 # Mid 함수 : 문자열 내에서 주어진 구간을 잘라서 반환 (시작점, 이후 가져올 문자수) Mid("Company", 2, 2) # om 2022. 11. 8.
[Spotfire/초급] 계산된 컬럼 추가 계산된 컬럼 계산된 컬럼은 Data Table 내에 있는 Column들을 통계/논리/텍스트 등의 함수를 사용하요 새로운 Column을 만들어내는 중요한 기능입니다. 해당 기능은 Spotfire Report 상단 데이터 → 계산된 컬럼 추가 를 클릭하여 사용할 수 있습니다. 계산된 컬럼 구성 ① 사용 가능한 컬럼 : Data Table의 Column들이 출력 ② 컬럼에 대해 사용 가능한 속성 : 해당 Report 내의 변수로 사용할 수 있는 properties의 목록들이 출력 ③ 함수 : 계산된 컬럼에서 사용 가능한 함수 목록들이 출력 ④ 표현식 : 원하는 표현식을 기입하는 곳 ⑤ 컬럼 이름 : 새로 생성하는 Column의 이름을 작성 ⑥ 미리보기 : 기입한 표현식에 따른 결과 값을 보여줍니다 https:.. 2022. 11. 8.
[Spotfire/초급] Cross Table Cross Table Cross Table은 두 범주형 변수를 교차시켜서 해당 셀의 빈도 혹은 교차되는 수치형 변수의 통계량을 계산하여 분석하는 방법입니다. 시각화 유형에서 Data Table이 있는 상태로 하단의 산점도를 클릭하면 Chart가 생성됩니다. ①, ② 에 분석하고자 하는 범주형 변수를 설정합니다 (수치형 변수를 넣어도 알아서 구간화되어 범주형 변수처럼 표현됩니다) ③ 에 구하고자하는 수치형 변수의 통계량 or count & uniquecount 함수를 통해 셀의 빈도를 counting 하여 분석합니다. 셀에 색상 넣기 마우스 오른쪽 → 속성 → 색 → 추가(A)를 누르시면 색을 넣기 원하는 값을 기입할 수 있습니다. 이후 하단 컬러 모드(M) 에서 원하는 색상 지정 방법을 선택 (고정 / .. 2022. 11. 8.
[Spotfire/초급] 마킹 - Chart 내 Data 상세 속성 보여주기 Marking Marking : Spotfire에서 특정 Table 및 Chart 의 행 or 영역을 지정하는 기능 Marking은 Spotfire Visualization에서 가장 강력한 기능 중 한 가지 입니다. 이 기능을 통해 상세 시각화(Drill-Down), Marking 행 공유, Marking Data Excel 추출 등의 기능을 할 수 있습니다. 상세 시각화 하단에 있는 3개의 Chart를 보면 ① 첫번째 Pie Chart에서 특정 초등학교를 클릭하니 → 두번째 Cross Table에 해당 초등학교를 보낼 수 있는 아파트 List들이 나오고 ② 두번째 Cross Table에서 특정 아파트를 클릭하니 → 세번째 Bar Chart에 해당 아파트의 면적당 평균 가격이 나오는 것을 볼 수 있습니다.. 2022. 11. 8.
반응형