새로운 이야기들 | 요즘IT

‘데이터

’에 대한 검색 결과

작가 1

콘텐츠 1,323

데이터 사이언티스트에게 아나콘다가 인기 있는 이유 (上)

8분

2021.06.21.

빅데이터나 인공지능 관련 업종에 있는 사람들은 어떤 프로그래밍과 툴, 프레임워크 등을 사용하냐에 대해 많은 이야기를 나눕니다. 그 대표적인 예로 ‘파이썬 vs R’이라는 주제는 데이터 사이언티스트들에게 늘 뜨거운 이야깃거리였습니다. 하지만 최근 들어서 적어도 어떤 툴을 가지고 데이터 분석 작업을 진행하느냐에 대해서는 이 논란이 많이 줄어들었습니다. 바로 아나콘다(Anaconda)라는 툴킷(Toolkit)이 어느새 대세로 자리 잡았기 때문입니다. 이번 시간에는 아나콘다란 무엇인지, 그리고 이 아나콘다가 어떤 장점이 있길래 많은 데이터 사이언티스들이 선택하고 있는지 알아보도록 하겠습니다.

삼더하기일

디자인

데이터 시각화 101: ⑤어떤 색을 어떻게 사용해야 할까?

7분

2024.02.26.

색의 사용은 데이터 시각화에서 정보를 전달하는 데 매우 중요한 역할을 합니다. 색은 복잡한 데이터를 직관적으로 이해할 수 있도록 도와주며, 사용자의 주의를 끌고, 정보를 명확하게 전달하는 수단으로 사용됩니다. 하지만, 색을 사용할 때 주의해야 할 사항들이 존재합니다. 이 글에서는 데이터 시각화에 필요한 색의 기본 개념과 정보 전달을 돕는 색의 사용법에 대해 알아보겠습니다.

신유진

디자인

데이터 시각화 101: ④언제 어떤 차트를 사용해야 할까

6분

2024.01.09.

인기

데이터 시각화는 복잡한 데이터를 시각적으로 쉽고 명확하게 표현하는 과정입니다. 그러나 실제로 시각화 작업을 시작할 때, 어떤 정보를 전달해야 하며 어떻게 효과적으로 시각화해야 할지 막막할 때가 있습니다. 이 글에서는 데이터 시각화의 주요 목적들을 여섯 가지로 나누고, 각 목적에 맞는 다양한 시각화 유형들을 정리해 보았습니다. 비교에서부터 흐름에 이르기까지, 각 시각화 목적에 따른 차트 사용법에 대해 자세히 살펴보도록 하겠습니다.

신유진

개발

데이터가 곧 가치인 시대, 성패는 데이터 품질에 달려있다

9분

2023.07.26.

<데이터 품질의 비밀(Data Qualtiy Fundamentals)> 원저자들의 책 출간 기념 인터뷰를 요약했어요. 책을 기반으로 데이터 품질의 정의부터 데이터 신뢰성, 옵저버빌리티 등 관련 내용을 응축한 질문과 답변이 담겨 있어서 이 글을 읽으면 미리 <데이터 품질의 비밀: 데이터 신뢰를 쌓는 데이터옵스의 핵심과 엔드 투 엔드 단계별 가이드>을 맛볼 수 있어요. 더 심화된 내용 또는 다양한 사례를 책으로 읽기 전에 이 글을 워밍업으로 읽으면 좋아요.

디코딩

개발

데이터 주도 프로덕트 개발을 위한 실험 환경 세팅하기

11분

2023.04.25.

PO(Product Owner)는 옵션 A를 진행할지, 옵션 B를 진행할지, 또는 더 나은 결과를 얻으려면 어떤 버전의 화면을 구현해야 하는지 고민하는 경우가 많습니다. 특히 제한된 리소스로 촉박한 마감 시한에 쫓기는 경우 이러한 결정을 내리는 것은 어려운 일일 수 있습니다. 게다가 이러한 결정은 개인적인 판단이나 경쟁사의 접근 방식을 모방하여 이루어지기 때문에 최적의 결과를 얻지 못할 수 있습니다. 다행히도 비교적 적은 노력으로 간단한 실험 환경을 세팅하면 이러한 함정을 피할 수 있습니다. 이 글에서는 이를 달성하는 방법을 설명하고자 합니다.

요즘IT의 번역글

기획

성장하고 싶은 데이터 분석가를 위한 추천 도서 6권

7분

2023.03.22.

데이터 분석가로 취업을 준비할 때 어떻게 공부해야 할지, 어떤 책이 도움이 될지 고민한 적 있으신가요? 데이터 분석가에게 필요한 역량은 데이터 문해력, 실험, 지표 등 범위가 넓습니다. 저 또한 같은 고민을 했던 사람이라, 실제 데이터 분석가로 일하면서 도움받았던 도서 6권을 소개하고자 합니다. 논리, 통계, 그로스 해킹 등 도움이 될 만한 주요 역량을 바탕으로 책을 선정했습니다. 이번 글은 주니어 데이터 분석가 또는 데이터 분석가로 성장하고 싶은 취업 준비생에게 도움이 될 만한 책이니 참고해 보시길 바랍니다.

주정민

개발

‘액션-계산-데이터’ 관점으로 보는 함수형 프로그래밍 패러다임

20분

2022.05.17.

함수형 프로그래밍을 배우면서 깨달은 것이 있습니다. 실제 함수형 프로그래밍의 본질은 그렇게 어려운 것이 아닌데 이걸 설명하기 위해서는 대단히 어려운 일이 많았습니다. 아마 함수형 프로그래밍에 쓰이는 용어들이 대부분 낯설기 때문일지도 모릅니다. 최근 함수형 프로그램을 더 깊이 공부하다가 실제로 알려주고 싶었던 것이 방법이나 용어가 아닌, 코드를 함수형으로 생각하는 ‘함수형 사고 패러다임’이라는 걸 깨달았습니다. 그래서 오늘은 함수형 사고 패러다임을 바탕으로 새롭게 함수형 프로그래밍에 관한 글을 써보려고 합니다.

테오의 프론트엔드

개발

양질의 데이터를 판별하는 5가지 방법 : ④ 데이터 형식을 파악했는가?

8분

2021.10.25.

데이터 구조와 생김새에서 모든 데이터는 차이를 보입니다. 그리고 데이터의 생김새, 즉 데이터 형식에 따라서 분석 가치가 높은 양질의 데이터와 그렇지 못한 저품질의 데이터가 나뉘기도 합니다. 한 가지 흥미로운 점은 양질의 데이터일수록 데이터 형식에 특별한 공통점이 있고 저품질의 데이터 역시 마찬가지로 그 형식에 어떠한 특징이 존재하고 있습니다. 이번 편에서는 데이터 형태에 따라 갈리는 분석 잠재력에 대해 자세히 살펴보도록 하겠습니다.

삼더하기일

개발

양질의 데이터를 판별하는 5가지 방법 : ① 데이터 양은 충분한가?

9분

2021.10.06.

양질의 데이터 조건 첫 번째는 ‘충분한 양의 데이터’입니다. 최근 빅데이터라는 단어가 기승을 부리고 있으며 빅데이터는 기본적으로 방대한 양의 데이터를 의미합니다. 하지만 현실적으로 마주하게 되는 데이터들이 모두 방대한 양을 지니고 있지는 않습니다. 1,000개가 되지 않는 데이터를 보는 것은 다반사이며, 심한 경우에는 단 한 줄의 데이터가 ‘데이터’라는 이름으로 유포되고 있기도 합니다. 기본적으로 적은 데이터 수는 곧바로 분석 결과의 신뢰성 하락으로 연결됩니다. 많은 데이터를 통해 충분히 검증한 결과와 그렇지 않은 결과의 차이입니다.

삼더하기일

개발

개발자가 알아야 할 데이터 지향 프로그래밍 with JDK 20

19분

2023.08.08.