- Learn on Towards Data Science ์ฃผ์ ๋ณ ๊ธ ๋ชจ์ ๋งํฌ
- Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines
- R์์ ํ์ด์ฌ๊น์งโฆ๋ฐ์ดํฐ๊ณผํ ํ์ต ์ฌ์ดํธ 8๊ณณ
- ๋ฆฌ๋ค, ๊ธฐ์ ์ ์ํ ๋ฐ์ดํฐ๊ณผํ ๊ฐ์ ๊ณต๊ฐ
- Data Analysis - YouTube
- ๋ฐ์ดํฐ๊ณผํ์ ์ ๋ฌธํ๊ณ ์ถ๋ค๋ฉด, ์ด๊ณณ๋ถํฐ
- ๋ฐ์ดํฐ๊ณผํ์ ์์ํ ๋ ๋์๋๋ ๊ฒ๋ค
- ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์ ํ์ต ๋ก๋๋งต (๋ฒ์ญ) โ ์ด๋ฐ๋ฅ๋ฌ์ฐ์ค
- ํฌ๋ก ๋ฐ์ดํฐ ๊ณผํ- ํฌ๋ก ๋ฐ์ดํฐ ๊ณผํ๋น์ ์ ์ถ๊ณผ ์ ๋ฌด๋ฅผ ๋ฐ๊พธ๋ ๋ฐ์ดํฐ ๊ณผํ (๋ฐ์ดํฐ ์ฌ์ด์ธ์ค)
- ์ธ์ ๋ฐ๋ ๋ฐ์ดํฐ ๋ถ์๊ฐ ๋๊ธฐ โ ์ธ๋ถ ์ธ๋ฏธ๋ ์์ฝ โ
- ๋ฐ์ดํฐ ๋ถ์๊ฐ๋ ์ด๋ค SKILLSET์ ๊ฐ์ ธ์ผ ํ๋๊ฐ?
- ๋น๊ทผ๋ง์ผ ํ๊ณผ ๋ฐ์ดํฐ ๋ถ์. ํ๋ก๋ํธ ๋ฐ์ดํฐ ๋ถ์๊ฐ๋ ์ด๋ค ์ผ์ ํ๋๊ฐ | by matthew l | ๋น๊ทผ๋ง์ผ ํ๋ธ๋ก๊ทธ | Aug, 2021 | Medium
- ๋ฐ์ดํฐ ๋ถ์๊ฐ๊ฐ ๋๊ธฐ ์ํด์๋?
- ๋ฐ์ดํฐ ๋ถ์, ์์ฌ์์ ์ ๋ฌ๊น์ง | Pega Devlog
- ๋ฐ์ดํฐ ๋ถ์์ด๋ ๋ฌด์์ผ๊น ๊ธฐ์ ์ ์ธ ์ด์ผ๊ธฐ๋ ์๋
- Overfitting์ ํผํด๋ณด์!
- ์์ ์กํ๋ ๋ฐ์ดํฐ ๊ณผํ ์ด์ผ๊ธฐ
- How to Become a Data Scientist for Free
- ๋ฐ์ดํฐ ๊ณผํ์ ์งํฑํ๋ ๊ธฐ๋ณธ๊ธฐ
- Hiring data scientists
- Top Python Data Science Interview Questions | .cult by Honeypot
- GitHub Special: Data Scientists to Follow & Best Tutorials on GitHub
- How to Become a Data Scientist
- So You Want To Be a Data Scientist: A Guide for College Grads
- Aspiring data scientist? Master these fundamentals
- How I Became a Data Scientist Despite Having Been a Math Major
- Data Scientist: The Sexiest Job of the 21st Century
- Lessons in Becoming an Effective Data Scientist
- PyData Paris 2016 - Round table: "How to become a data scientist"
- Renee Teate | Becoming a Data Scientist Advice From My Podcast Guests
- How to land a Data Scientist job at your dream companyโโโMy journey to Airbnb
- ์ด์์~ ๋ฐ์ดํฐ์ฌ์ด์ธํฐ์คํธ๋ ์ฒ์์ด์ง?
- ์ฅ๋ฐ๊ตฌ๋๋ฅผ ๋ ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ
- B๊ธ ํ๋ก๊ทธ๋๋จธ ๋ฐ์ดํฐ ๊ณผํ์๋ก ์ทจ์งํ๋ ค๋ฉด ๋จ๋ค์ฒ๋ผ ํ์ง ๋ง๋ผ
- ์ธ์์์ ๊ฐ์ฅ ์ดํด๋ฐ์ง ๋ชปํ๋ ์์ , ๋ฐ์ดํฐ ๊ณผํ์ (1/3)
- ์ธ์์์ ๊ฐ์ฅ ์ดํด๋ฐ์ง ๋ชปํ๋ ์์ , ๋ฐ์ดํฐ ๊ณผํ์ (2/3)
- ์ธ์์์ ๊ฐ์ฅ ์ดํด๋ฐ์ง ๋ชปํ๋ ์์ , ๋ฐ์ดํฐ ๊ณผํ์ (3/3)
- ๋ฐ์ดํฐ๋ถ์๊ฐ์ ๋ถ์ํฌํธํด๋ฆฌ์ค๋ง๋ค๊ธฐ ยท Present
- ์นด์ผ๋ฐ์ด : ์นด์ผ์ ๋ฐ์ดํฐ ์ด์ผ๊ธฐ - YouTube
- Full Stack Data Science: The Next Gen of Data Scientists Cohort | by Jay Kachhadia | Towards Data Science
- Engineers as Data Scientists?. How the Trends of IoT and Big Data canโฆ | by Christianlauer | Jun, 2022 | Medium
- Is Data Science a Dying Profession? | R-bloggers
- Data Science Career Ladder - YouTube
- Data Engineering Technology Tree | Jesse Anderson DBA/Data Warehouse/SQL-Focused, Software Engineer, Data Scientists tech stack tree
- The Rise of the Data Engineer
- ๋ฐ์ดํฐ ์ง๊ตฐ ์๋ด์: DA, TA, DE, DS, ML์์ง๋์ด, BI ๋ถ์๊ฐ
- A Beginnerโs Guide to Data Engineering
- Part I
- ์ฃผ๋ ๋ด์ฉ
- ๋ฐ์ดํฐ ์์ง๋์ด๋ง์ด ๋ฌด์์ด๊ณ ์ ์ด๋ ค์ด์ง?
- ๋ฐ์ดํฐ ๊ณผํ์ ๊ณ์ธต ๊ตฌ์กฐ
- ETL ํ๋ ์์ํฌ (airflow ์๊ฐ)
- ๋ ๊ฐ์ง ํจ๋ฌ๋ค์ : SQL- v.s. JVM ์ค์ฌ์ ETL ๋น๊ต
- ๋ถํํ๋ ๋ง์ ๊ธฐ์ ๋ค์ ๊ธฐ์กด์ ๋ฐ์ดํฐ ๊ณผํ ๊ต์ก ํ๋ก๊ทธ๋จ ์ค ๋๋ถ๋ถ์ด ํ๊ณ ๋๋ ์ ๋ฌธ์ง์ธ ๊ฒฝ์ฐ ํผ๋ผ๋ฏธ๋ ์ง์์ ์ต์ ๋ถ๋ถ(Ex. AI)์ ์ง์คํ๋ ๊ฒฝํฅ์ด ์๋ค๋ ๊ฒ์ ์ธ์ํ์ง ๋ชปํฉ๋๋ค, ๋๋ถ๋ถ์ ํ์๋ค์๊ฒ ํ ์ด๋ธ ์คํค๋ง๋ฅผ ์ ์ ํ๊ฒ ์ค๊ณํ๊ฑฐ๋ ๋ฐ์ดํฐ ํ์ดํ ๋ผ์ธ์ ์์ฑํ๋ ๋ฐฉ๋ฒ์ ๊ฐ๋ฅด์น์ง ์์ต๋๋ค.
- ETL์ ์ผ๋ถ์คํ ๊ตฌ์ฑ ํ์ผ์ ๊ฐ์ ธ์์ ํด๋น ์คํ์ ๋ํ ๊ด๋ จ ์ธก์ ํญ๋ชฉ์ ๊ณ์ฐํ๊ณ ๋ง์ง๋ง์ผ๋ก UI์์ p ๊ฐ ๋ฐ ์ ๋ขฐ ๊ตฌ๊ฐ์ ์ถ๋ ฅํ์ฌ ์ ํ ๋ณ๊ฒฝ์ผ๋ก ์ธํด ์ฌ์ฉ์ ๋ณ๋์ด ๋ฐฉ์ง๋๋์ง ์ฌ๋ถ๋ฅผ ์๋ฆด ์ ์์ต๋๋ค. ๋ ๋ค๋ฅธ ์๋ ์ผ์ผ ๋จ์๋ก ๊ธฐ๊ณ ํ์ต ๋ชจ๋ธ์ ๊ธฐ๋ฅ์ ๊ณ์ฐํ์ฌ ์ฌ์ฉ์๊ฐ ๋ฉฐ์น ์ด๋ด์ ์ดํํ๋์ง ์์ธกํ๋ ๋ฐฐ์น ETL ์์ ์ ๋๋ค. ๊ฐ๋ฅ์ฑ์ ๋ฌดํํฉ๋๋ค!
- SQL ์ค์ฌ ETL์ ์ผ๋ฐ์ ์ผ๋ก SQL, Presto ๋๋ Hive์ ๊ฐ์ ์ธ์ด๋ก ์์ฑ๋ฉ๋๋ค. ETL ์์ ์ ์ข ์ข ์ ์ธ์ ๋ฐฉ๋ฒ์ผ๋ก ์ ์๋๋ฉฐ ๊ฑฐ์ ๋ชจ๋ ๊ฒ์ด SQL ๋ฐ ํ ์ด๋ธ์ ์ค์ฌ์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค. UDF๋ฅผ ์์ฑํ๋ ๊ฒ์ ๋๋ก๋ ๋ค๋ฅธ ์ธ์ด (์ : Java ๋๋ Python)๋ก ์์ฑํด์ผ ํ๊ธฐ ๋๋ฌธ์ ๋ฒ๊ฑฐ๋กญ์ต๋๋ค. ์ด ์ด์ ๋๋ฌธ์ ํ ์คํธ๊ฐ ํจ์ฌ ์ด๋ ค์ธ ์ ์์ต๋๋ค. ์ด ํจ๋ฌ๋ค์์ ๋ฐ์ดํฐ ๊ณผํ์๋ค ์ฌ์ด์์ ์ธ๊ธฐ๊ฐ ์์ต๋๋ค.
- ์ฃผ๋ ๋ด์ฉ
- Part II
- Part I
- A Beginnerโs Guide to Data Engineering
- data-engineering-zoomcamp: Free Data Engineering course!
- ์๋ฆฌ์ฆ | IBM Data Science - DEV_SK
- ๋ฐ์ดํฐ ์ํคํ ์ฒ์ ๋ณํ ETL -> ELT
- ์ธํฐ๋ทฐใ ฃ"๊ธฐ์ ํ์ฌ๋ IT ํ๋ํํด์ผ ํ๋ค" ํค์ฌ์ดํธ ํ ํฌ๋๋ก์ง์ค CIO - CIO Korea ETL -> ELT๋ก์ ์ด์
- ์นผ๋ผใ ฃ'ETL'์ ๋น ๋ฐ์ดํฐ์์ ๊ฒฝ์์์ ํจ๋ฐฐํ๋ค - CIO Korea ETL -> ELT or pipelined data streaming
- ETL, ELT์ 4๊ฐ์ง ์ฃผ์ ์ฐจ์ด์ - ๋ฐฅ๋จน๋ ๊ฐ๋ฐ์
- ETL vs ELT, ๋น์ ์ ์ ํ์?. ELT์ ์ฅ๋จ์ ๊ณผ ๋๋ผ์ดํธ๋ฃธ์์์ ๋์ ํ๊ธฐ | by Chris Lee | DelightRoom | Jan, 2024 | Medium
- GumGum Builds and Maintains High-Performance ETL Pipelines for Ad Exchange Reporting - YouTube
- Tables as Code: The Journey from Ad-hoc Scripts to Maintainable ETL Workflows at Booking.com - YouTube
- I want to study Data Science Wiki ํ๊ธ
- A Beginnerโs Guide to the Data Science Pipeline
- Big Data: Its Benefits, Challenges, and Future | by Benedict Neo | Oct, 2020 | Towards Data Science
- Big Data Pipeline Recipe. Introduction | by Javier Ramos | Aug, 2020 | ITNEXT
- Designing Functional Data Pipelines for Reproducibility and Maintainability | PyData Global 2021 - YouTube
- Data Engineering Principles - Build frameworks not pipelines - Gatis Seja - YouTube
- Live Data Demo โ Practical Pipelines - YouTube
- 29CM ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ์๊ฐ. ์๋ ํ์ธ์ ๋ฐ์ดํฐ๊ทธ๋ก์คํ ์ด์งํ์ ๋๋ค. 29CM์์ 21๋ 9์โฆ | by brownbears | 29CM TEAM | Jan, 2023 | Medium
- FMS(์ฐจ๋ ๊ด์ ์์คํ ) ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ๊ธฐ 1ํธ. ์คํธ๋ฆฌ๋ฐ/๋ฐฐ์น ํ์ดํ๋ผ์ธ ๊ฐ๋ฐ๊ธฐ - SOCAR Tech Blog
- FMS(์ฐจ๋ ๊ด์ ์์คํ ) ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ๊ธฐ 2ํธ. ์ ๋ขฐ์ฑ ๋์ ๋ฐ์ดํฐ๋ฅผ ์ํ ํ ์คํธ ํ๊ฒฝ ๊ตฌ์ถ๊ธฐ - SOCAR Tech Blog
- FMS(Fleet Management System) ์ฃผํ์ด๋ฒคํธ ํ์ดํ๋ผ์ธ ๊ฐ์ ๊ธฐ - SOCAR Tech Blog
- Data Pipelines Overview
- How to jump into Data Science
- Functional Data Engineeringโโโa modern paradigm for batch data processing
- Data Engineers are in Greater Demand than Data Scientists
- Data Infrastructure at In Loco
- Loco ๋ผ๋ ํ์ฌ์์ ์ผ ์ฝ 15TB ๋ฐ์ดํฐ๋ฅผ ๋ถ์ ๋ฐ BI ํ๋ซํผ์ ํ์ฉํ๋ ๋ฐ์ดํฐ ์ธํ๋ผ ์ค๋ช
- Kafka, Presto, Airflow, Spark ์ฌ์ฉ
- Data engineers vs. data scientists
- ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ vs ๋ฐ์ดํฐ ์์ง๋์ด: ์ฃผ์ ์ฐจ์ด์ ๊ณผ ์ดํด
- ์์นด ๋ฐ์ดํฐ ๊ทธ๋ฃน - ๋ฐ์ดํฐ ์์ง๋์ด๋ง ํ์ด ํ๋ ์ผ - SOCAR Tech Blog
- ์ค๋ฌด AI ํ๋ก์ ํธ - ๋ถ์๋ณด๋ค ์์ง๋์ด๋ง์ด ์ค์ํ ์ด์
- Analytics Engineer ๋? (Feat. Modern Data Stack)
- Analytics Engineer ๋? (Feat. Modern Data Stack)
- Coalesce 2022 New Orleans ํ๊ธฐ - Analytics Engineering ๊ทธ๋ฆฌ๊ณ Modern DataStack
- How The Modern Data Stack Is Reshaping Data Engineering | Preset - Blog | Preset
- ์จํ๋ ๋ฏธ์ค ๋ฐ์ดํฐ ํ๋ซํผ ํ์ ๋ฐ์ดํฐ ์์ง๋์ด๊ฐ ํ๋ ์ผ(feat. 11๋ฒ๊ฐ ๋ฐ์ดํฐ ํ๋ซํผ 2020๋ ํ๊ณ ) :: Kaden Sungbin Cho
- ์์นด ์ ์ ๋ฐ์ดํฐ ์์ง๋์ด ๋๋์ 4๊ฐ์ ํ๊ณ - SOCAR Tech Blog
- Data Product (1) ์์นด ๊ณ ๊ฐ์ ๋ฌด์จ ๋ชฉ์ ์ผ๋ก ์์นด๋ฅผ ์ด์ฉํ ๊น? - SOCAR Tech Blog
- Data Product (2) AI(๋ฐ์ดํฐ)๋ก ์ค์ ์ด์ ํจ์จํ๊ฐ ๊ฐ๋ฅํ ๊น? - SOCAR Tech Blog
- ๋ฐ์ดํฐ ์์ง๋์ด๋ ๋ฌด์์ผ๊น? - NephtywโS Programming Stash
- ๋ฐ์ดํฐ๋ถ์๊ฐ vs ๋ฐ์ดํฐ์์ง๋์ด vs ๋ฐ์ดํฐ๊ณผํ์ ์ฐจ์ด๊ฐ ๋ญ๊น? (1) ์ญํ ๊ณผ ์ ์
- ๋ฐ์ดํฐ๋ถ์๊ฐ vs ๋ฐ์ดํฐ์์ง๋์ด vs ๋ฐ์ดํฐ๊ณผํ์ ์ฐจ์ด๊ฐ ๋ญ๊น? (2) ํ์ ์ญ๋, ๊ธฐ์
- ๋ฐ์ดํฐ๋ถ์๊ฐ vs ๋ฐ์ดํฐ์์ง๋์ด vs ๋ฐ์ดํฐ๊ณผํ์ ์ฐจ์ด๊ฐ ๋ญ๊น? (3) ์ฐ๋ด๊ณผ ๋ณด์
- Roadmap to Data Engineering in 2022. | by Chetan Dekate | Mar, 2022 | Medium
- Thereโs No Such Thing as a Data Scientist
- ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ๊ฐ ๋๊ธฐ ์ํด ํ์ํ ๊ธฐ์ ,์ด ๋ฌธ์ฅ๋ง ๋ณด๋ฉด ๋ค ์ ์ ์๋ค
- ์๋ก์ด ๋ฐ์ดํฐ ๋ถ์๊ฐ์์ ๋๋ฐ๋ถ๋ฅผ ์ํ์ฌ(2) SQL ์ค์์ฑ ๊ฐ์กฐ
- ๋ฐ๋ผ ํ๋ ๋ฐ์ดํฐ ๊ณผํ โ ๊ฐ์ PPT
- datasciencetech.institute
- mindscale.kr
- How to actually learn data science
- Skills You Need for that Data Science Job
- ๋ฐ์ดํฐ๊ณผํ ์๋ฃ๋ชจ์
- A curated list of data science blogs
- Data Science Courses
- Faster Data Science Education Kaggle
- Pascal Poupart's Homepage
- dataquest.io
- Linear Algebra for Data Scientists
- Reading Between the Lines: How We Make Sense of Usersโ Searches
- Research papers that changed the world of Big Data
- Paper Search using ScopusAPI | Pega Devlog
- Data Analysis (1): Neuroimaging Data loading using SPM8 toolbox
- ๋น์ ์ด ์๊ณ ์๋ ์ข์ ๋ฐ์ดํฐ ๋ถ์ ์ฌ๋ผ์ด๋๊ฐ ์๋์?
- The last-mile problem: How data science and behavioral science can work together
- The democratization of predictive analytics
- Tracking Economic Development with Open Data and Predictive Algorithms
- Predictive maintenance
- Data Science for Startups: Predictive Modeling
- ๊ณต๊ณต๋ฐ์ดํฐ๋ฅผ ์ฐ๊ฒฐํ๋ผโฆโLODโ
- GE์ฐ์ ์ธํฐ๋ท ํ๋ซํผ, ํ๋ ๋์คโข(Predixโข)์ ๋ํด ์์์ผ ํ ๋ชจ๋ ๊ฒ
- articles
- ํธ์ํฐ๋ก ๋ค์ฌ๋ค๋ณด๋ ๋น ๋ฐ์ดํฐ ๋ถ์
- ๋ฒ์ฆํผ๋์ ๊ตํ: ๋ถ์ฐ ๋ฏธ๋์ด์ ๋ฐ์ดํฐ ๋ถ์
- ์ค๋ฆฌ์ฝ ๋ฐธ๋ฆฌ ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ์ ํ๋ฃจ
- โ๋ฐ์ดํฐ์ ์ก์ ์ ์จ๊ฒจ์ง ์ง์ค์ ์ฐพ์๋ผโ
- Data Science From Scratch: First Principles with Python
- Three Things About Data Science You Won't Find In the Books
- Weekly Digest, January 8
- Weekly Digest, June 15
- Grepping logs is terrible
- Grepping logs is still terrible
- Why Topological Data Analysis Works
- Topological Data Analysis (TDA) is a cool thing that data scientists should know
- HyperLogSandwich
- Pipelining - A Successful Data Processing Model
- NASA'S DATA PORTAL
- ์ ์ ํ ๋ฐ์ดํฐ๋ฅผ ๋์ฅ๊ณ ์์ ๊บผ๋ด๊ธฐ
- Algorithm reduces size of data sets while preserving their mathematical properties
- A BEGINNER'S GUIDE TO DATA ANALYSIS WITH UNIX UTILITIES
- Enterprise Data Analysis and Visualization: An Interview Study
- Why Interactive Data Visualization Matters for Data Science in Python | PyData Global 2021 - YouTube
- Prologue to Data Science
- Data Science in Clojure at Yieldbot
- Mining the Web to Predict Future Events
- Using Data Science to Measure a Musical Revolution
- Data Science Career Alert - June 12
- Comparing Python and R for Data Science
- Data Science for Startups: R -> Python
- Introducing ShArc: Shot Arc Analysis
- Inside Data@Scale 2015
- DataLake
- A Data Lake Architecture With Hadoop and Open Source Search Engines
- ๋ฐ์ดํฐ ๊ด๋ฆฌ ํจ๋ฌ๋ค์ ๋ฐ๊พผ โ๋ฐ์ดํฐ ๋ ์ดํฌโ (1) - ๋ฐ์ดํฐ๋ท
- ๋ฐ์ดํฐ ๊ด๋ฆฌ ํจ๋ฌ๋ค์ ๋ฐ๊พผ โ๋ฐ์ดํฐ ๋ ์ดํฌโ (2) - ๋ฐ์ดํฐ๋ท
- ๋ฐ์ดํฐ ๊ด๋ฆฌ ํจ๋ฌ๋ค์ ๋ฐ๊พผ โ๋ฐ์ดํฐ ๋ ์ดํฌโ (3) - ๋ฐ์ดํฐ๋ท
- ๋น ๋ฐ์ดํฐ ๋ถ์ ์ํ ๋๊ท๋ชจ ํ์ฅํ ์คํ ๋ฆฌ์งยทยทยท โ๋ฐ์ดํฐ ๋ ์ดํฌโ A to Z - CIO Korea
- Data Lake with Serverless | ์์์ผ ์คํ 9์
- Data Warehouse vs. Data Mart vs. Data Lake | by Christianlauer | Jul, 2022 | Medium
- ๊ธฐํํน์ง โ์ฐฝ๊ณ โ์ โํธ์โ๋ฅผ ๋์ด์๋ ๋ฐ์ดํฐ ๋ ์ดํฌํ์ฐ์ค lakehouse
- โ์ผ๊ด์ฑยท์ ์ฐ์ฑโ ๋์ ๊ฐ๊ดโฆ ๋ฐ์ดํฐ ๋ ์ดํฌํ์ฐ์ค ํ์ฉ ์ฌ๋ก - CIO Korea
- Data Lake vs. Data Lakehouse | 01
- What is a Data Fabric?. How to realize modern Data Management | by Christianlauer | Aug, 2022 | Medium
- Data Warehouse vs. Data Lake vs. Data Fabric | by Christianlauer | Nov, 2022 | Medium
- Data Maven
- Data Catalog, ๋ฐ์ดํฐ๊ฒฝํ์ ์ฌ๋ฆฌํ ๋ฒ์น. https://us.semantix.ai/ | by reckoner | Nov, 2022 | Medium
- ryd.io - A data science exploration of the NYC Taxi data set via clustering and time-series analysis
- ํ๋ ์๋, ์์ธก ๋ถ์ ๊ธฐ์ ํด๋ผ์ฐ๋ ์๋น์ค๋ก ์ถ์
- 11 Facts about Data Science that you must know
- The Data Science Workflow
- Eric Ma - Principled Data Science Workflows | PyData Boston July Virtual Meetup - YouTube
- ํด๋ฌผ๊ฐ๋ฐ์๊ฐ ์๊ฐํ๋ ๋น ๋ฐ์ดํฐ ๊ธฐ์
- Predicting winners of the Rugby World Cup
- Building Analytics at 500px
- 2015 Data Science Salary Survey / 2015 ๋ฐ์ดํฐ๊ณผํ ์๋ ์กฐ์ฌ
- ๋ฐ์ดํฐ๊ณผํ์๋ค์ ์คํ์ค, ๋๋ฒ์์ค
- 50 years of Data Science
- ๊ธฐํ์ยท๋ง์ผํฐ๊ฐ ์์๋ ๋ฐ์ดํฐ๊ณผํ ์์น 6๊ฐ์ง
- ์ฐ๋ฆฌ ์๋น ๊น์ฌ์ฅ์ด ๋ฐ์ดํฐ ๊ณผํ์๊ฐ ๋ ์ฌ์ฐ์?
- ๋ฐ์ดํฐ ๊ณผํ์์์ AI ์ฐ๊ตฌ์๋ก ๋ค์ด์๋ฉฐโฆ
- e์ปค๋จธ์ค ๋ฐ์ดํฐ ํํค์น๊ธฐ-6ํธ
- ๋ฐ์ดํฐ์ ๊ด๋ จํ์ฌ ๊ธฐ์ ๋ค์ด ๊ณต๊ฐํ ๊ธฐ์ ์ ์ด๋ค๊ฒ ์์๊น?
- The Automatic Statistician - An artificial intelligence for data science
- ์ข๋ค๋ ๊ฑด ์๊ฒ ๋๋ฐ ์ข ์จ๋ณด๊ณ ์ถ์. ๋ฐ์ดํฐ! - ๋๋ฒ์์ค ํ์ฉํธ ๋ํ
- โ๋ฐ์ดํฐโ๋ฅผ ๋๋ํ๊ฒ ๋ง๋๋ ์คํ์์ค ๊ธฐ์ 12์ข
- Google Data Studio (beta) provides everything you need to turn your data into beautiful, informative reports that are easy to read, easy to share, and fully customizable
- ์ฝ๊ฒ ์ดํดํ๋ ๋ชจ๋ฐ์ผ ๋ฐ์ดํ ๋ถ์
- ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ๋ก ์ฑ์ฅํ๊ธฐ
- Data School
- github.com/collections/open-journalism
- data.fivethirtyeight.com
- ์ด๋ป๊ฒ ํ๋ฉด ์ฑ์ฑํ ๋ฐ์ดํฐ๋ฅผ ๋ชจํ์ ๋ฐ๋ก ์ ์ฉํ ์ ์์๊น? โ Bayesian Online Leaning
- ๋ฐ์ดํฐ ๊ณผํ ์ฌ๋ฆ ํ๊ต 2016
- ๋ฐ์ดํฐ์ ํํน๋์ง ์๊ณ , ๋ฐ์ดํฐ๋ฅผ ์ ํ์ฉํ ์ ์๋ 14๊ฐ์ง ๋ฃฐ
- Demystifying Different Roles in Data Team
- Why Data Science Teams Need Generalists, Not Specialists ์คํ์ ๋ฆฌ์คํธ๊ฐ ์๋ ์ ๋๋ด๋ฆฌ์คํธ๋ ํ์ํ๋ค
- Causal Data Science
- Announcing the general availability of the Microsoft Excel API to expand the power of Office 365
- 16 analytic disciplines compared to data science
- ๊ธ๋ก๋ฒ ์ฌ๋ก๋ก ๋ณด๋ ๋ฐ์ดํฐ๋ก ๋ ๋ฒ๋ ๋ฒ - ํธ๋ ์ ๋ฐ์ดํฐ (Treasure Data)
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ์ ๋ํ ๋ชจ๋ ๊ฒ
- ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ - Python ๋ฐ์ดํฐ ํธ๋ค๋ง๊ณผ ์๊ฐํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค๋ฌด
- ๋ฐ์ดํฐ ๊ณผํ์ ๊ณต๋ถํ๋ ์ด์
- ๋ฐ์ดํฐ๋ ์ฐจํธ๊ฐ ์๋๋ผ ๋์ด ๋์ด์ผ ํ๋ค
- Practical Data Science at Honestbee - DataScienceSG
- ๋น ๋ฐ์ดํฐ์ ๋์คํ
- ์ด๋ก ์ ์ข ๋ง: ๋ฐ์ดํฐ ํ์๊ฐ ๊ณผํ์ ์ฐ๊ตฌ๋ฐฉ๋ฒ์ ๊ตฌ๋ฅ๋ค๋ฆฌ๋ก ๋ง๋ ๋ค
- ์ด๋ฉ์ผ๋ก ๋ถ์ํด ๋ณด๋ ๋์ 3๋
- E-Mail ๋ฐ์ดํฐ ๊ณฑ์น์ด๋ณด๊ธฐ
- ์คํฐ๋๋ฝ๊ฐ๊ธฐ.zip
- GNMT๋ก ์์๋ณด๋ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ๊ธฐ๊ณ๋ฒ์ญ / ๊ตฌ๊ธ ์ ๊ฒฝ๋ง ๊ธฐ๊ณ๋ฒ์ญ ์์คํ ๋ฆฌ๋ทฐ
- Spark + R / spark + R ๊ธฐ๋ณธ ์ฌ์ฉ๋ฒ, ํน์ง๊ณผ ์ฅ๋จ์ ์๊ฐ
- Spark๋ฅผ ์ด์ฉํ ๋ถ์ฐ ์ปดํจํ / ๋ถ์ฐํ๊ฒฝ์์ ๋จธ์ ๋ฌ๋์ ์ด์ฉํ๊ธฐ ์ํ ๊ธฐ๋ฐ์ผ๋ก Spark์ ํด๋ผ์ฐ๋๋ฅผ ํ์ฉํ๋ ๋ฒ
- ๊ฐํํ์ต์ ํ์ฉํ ๋ํํ ์์คํ / ๋ํํ ์์คํ ์ ๊ตฌ์ฑํ๊ธฐ ์ํด ๊ฐํํ์ต์ ์ด์ฉํ๋ ๋ฐฉ๋ฒ ๋ฆฌ๋ทฐ
- How to Make Your Database 200x Faster Without Having to Pay More?
- ๋ฐ์ดํฐ ๋ถ์์ ์์ด ์ ํํ ์์น๊ฐ ํ์ํ ๊ฒ์ด ์๋๋ผ ๋ฐ์ดํฐ์ ์ถ์ด ๋๋ ๋น์จ ๋ฑ์ ๋ถ์ํ๋ ๊ฒฝ์ฐ์๋ ์ ์ฒด ๋ฐ์ดํฐ๊ฐ ์๋ ์ํ๋ง์ ํ๋ ๋ฐฉ์์ ์ด์ฉํ ์ ์๋ค๋ ๋ด์ฉ
- Presto, BlinkDB / G-OLA, SnappyData ๋ฑ๊ณผ ๊ฐ์ ์ํ๋ง ๋ฐฉ์์ ์ง์ํ๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ์๋ฃจ์ ์ ๋ํด์๋ ๊ฐ๋จํ๊ฒ ์๊ฐ
- 3 methods to deal with outliers
- Visual Information Theory
- ๊ฐ์ฅ ์๋ํ ๋ฐ์ดํฐ ๋ถ์๊ฐ
- Tutorial 1: Protein - DNA interaction
- A survey on predicting the popularity of web content
- Data analysis in excel
- Common Probability Distributions: The Data Scientistโs Crib Sheet
- dataplatforms.com
- ๋น ๋ฐ์ดํฐ ํ๋ผ๋ ์ค ํ๋ณธ์๊ฐ ํด์๋ก ์ ํํ ๊ฑฐ ๊ฐ์ง๋ง, ์ ํํธํฅ์ด ์๋ ๊ฒฝ์ฐ ์ค์ ์ ํ๋๋ 400๋ช ์ ํ๋ฅ ํ๋ณธ์ผ๋ก ์กฐ์ฌํ ๊ฒ๊ณผ ๋ง์ฐฌ๊ฐ์ง
- How to Start a Data Science Project in Python
- ๋ฐ์ดํฐ ๋ถ์์ ์ํ ๊ธฐ๋ณธ์ ์ธ Python ํ๊ฒฝ ์ค์ ๋ฐฉ๋ฒ
- Anaconda์ Conda๋ฅผ ํ์ฉํด ๋ถ๋ฆฌ๋ ํ๊ฒฝ ์ค์
- ํ๋์ Python ๋ฐ์ดํฐ ๋ถ์ ํ๋ก์ ํธ์ ๋๋ ํ ๋ฆฌ๋ฅผ ๊ตฌ์ฑํ๋ ๋ฐฉ๋ฒ
- 50 Best Data Science Project Ideas You Must Know in 2022
- Ian Ozsvald - Data Science Project Patterns that Work | PyData Global 2022 - YouTube
- Why Most Data Projects Fail & How to Avoid It โข Jesse Anderson โข GOTO 2023 - YouTube
- ์ด์ผ๊ธฐ 12. ๋น์ ์ ๋ฐ์ดํฐ ๋ฌธ๋งน(Data Illiterate) ์ธ๊ฐ?
- Q&A with leading Data Scientists
- ์๋ง์ ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ๋ค์ด ์ง์ฅ์ ๋ ๋๋ ์ด์ ๋ ๋ฌด์์ธ๊ฐ?
- Forrester vs Gartner on Data Science Platforms and Machine Learning Solutions
- sooyongshin.wordpress.com
- Data Science Ontology
- Automated Machine LearningโโโA Paradigm Shift That Accelerates Data Scientist Productivity @ Airbnb
- A list of artificial intelligence tools you can use todayโโโfor personal useย (1/3)
- Data Science Bowl 2017, Predicting Lung Cancer: Solution Write-up, Team Deep Breath
- Strata Data Conference
- Data Science Resources : Cheat Sheets
- Data Science Cheatsheets
- Top 28 Cheat Sheets for Machine Learning, Data Science, Probability, SQL & Big Data
- ds-cheatsheets: List of Data Science Cheatsheets to rule the world
- Getting started: the 3 stages of data infrastructure
- EVERYTHING A DATA SCIENTIST SHOULD KNOW ABOUT DATA MANAGEMENT
- Back To The Future: Data Engineering Trends 2020 & Beyond - Data Engineering Weekly Data Infrastructure, Data Architecture, Data Management๋ฅผ ์ฃผ์ ๋ก ์ฌ๋ฌ๊ฐ์ง ์ข์ ๊ธ link ๋ชจ์
- Silent data corruption: Mitigating effects at scale - Facebook Engineering
- Roadmap: Data Infrastructure ยท Bessemer Venture Partners
- The Guide to Modern Data Architecture | Future
- ๋ฐ์ดํฐ๋ฅผ ์ป์ผ๋ ค๋ ๋ ธ์ค์ค๋ ฅ
- #2.5. Intra/Inter-Class Variability ๋ฐ์ดํฐ์ '์ง'์ด๋?
- Analyzing GitHub, how developers change programming languages over time
- Regression ๋ชจ๋ธ ํ๊ฐ ๋ฐฉ๋ฒ
- 7 Techniques to Handle Imbalanced Data
- ์ด๊ธ์๋ฅผ ์ํ ๋ฐ์ดํฐ ๊ณผํ ๋น๋์ค 1: ๋ฐ์ดํฐ ๊ณผํ์ผ๋ก ๋ต๋ณํ ์ ์๋ 5๊ฐ์ง ์ง๋ฌธ
- Brunch Magzine List about Data Science
- ์คํ ๊ธ๋ก๋ฒ ๋ฐ์ดํฐ์ธํธ๋ฅผ ํ๊ตฌํ๊ณ ์๊ฐํํ๋ ๊ณผ์ ์ ๋ํด ํ์ธํด ๋ณด์ธ์
- ๋น ๋ฐ์ดํฐ : ์ํ ์์ ํ (quantity over quality)
- ๋ฐ์ดํฐ์ผ๋์2107 ๊ฐ๋จ ์ถ๊ทผ๊ธธ์ ํ๊ต/์ ์์ญ์ ๋ด๋ฆด ์ฌ๋ ์์ธกํ๊ธฐ
- How to Set Up Data Science?
- FIAN Research
- A Reference Stack for Modern Data Science
- Comprehensive Repository of Data Science and ML Resources
- Top 10 Popular GitHub Repositories to learn about Data Science
- If youโre a developer transitioning into data science, here are your best resources
- How to Handle Missing Data
- Missing Data Handling |How to Deal with Missing Data using Python
- 5 Amazing Improvement Big Data Can Bring toย Retail
- Notes On Using Data Science & Artificial Intelligence To Fight For Something That Matters
- Five Misconceptions about Data Science - Knowing What You Don't Know
- Data Preprocessing For Non-Techies: Basic Terms and Definitions
- What Getting A Job In Data Science Might Look Like
- Data Science. Intro
- Weekly SelectionโโโMar 2, 2018
- Big Data Engineering VS Data Warehousing
- ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค(Data Warehouse)์ ๋ฐ์ดํฐ ๋ ์ดํฌ(Data Lake)์ ์ฐจ์ด
- Free Data Engineering Course for Beginners - #1 EXTRACT - YouTube
- How โBigโ should be your Data?
- Self Driven Data ScienceโโโIssue #40
- How I automated my job search by building a web crawler from scratch
- ๋ค์ํ ์ฌ๋๋ค์ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ด์ผ๊ธฐ ํ๊ธฐ
- 10 Modern Data Trends
- Test-Driven Data Analysis - Nick Radcliffe
- Ways I Use Testing as a Data Scientist | Peter Baumgartner
- Data Science for Startups: R -> Python
- ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค(Data Science) ํ๋ก์ธ์ค ์ ๋ฆฌ
- ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ, ์คํ ๋ฐ์ดํฐ๋ฅผ ๋์ด ์ฝ๋ ๊ณต๊ฐ๋ก
- The Data Science of K-Pop: Understanding BTS through data and A.I.
- Should data scientists learn JavaScript?
- Data Science with Watson Analytics
- ๋ฐ์ด์ฝ ์ฃผ์ต 1ํ ํ๋ค ์์ ๋งค์ถ ์์ธก ๋ํ ์ฐ์น์ ์ฝ๋
- Dacon_KBO์ค์นด์ฐํ ์ฑ๋ฆฐ์ง ์กฐ์ฉ๊ฑด ์์1 ์ฝ๋์ค๋ช
- Mission 13. 2019 Jeju BigData Competition - ํด๊ทผ์๊ฐ ๋ฒ์ค์น์ฐจ์ธ์ ์์ธก
- Mission 11. ์๋์ง ๋น ๋ฐ์ดํฐ ํ์ฉ ๋ฐ์ดํฐ ์ฌ์ด์ธ์คยท์์ด๋์ด ์ฝํ ์คํธ
- ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค Meetup
- The penalty of missing values in Data Science
- Machine Learning and Data Science Applications in Industry ๋ค์ํ ๋ถ์ผ์ ์ ์ฉ ์
- 4 Pillars of Analytics Data acquisition, processing, surfacing and actioning are key to an effective analytics initiative
- Data Science for Startups: Tracking Data
- TF์์ ํ ๋น๋ฉ๊น์ง 9๊ฐ์์ ๊ธฐ๋ก : ์ฑ์ฅํ๋ ์กฐ์ง์ ๋ง๋๋ ์ฌ์
- Organizing and scaling an effective data team
- ๋น ๋ฐ์ดํฐ ์กฐ์ง๊ณผ ์์คํ
- Generating and visualizing alpha with Vectorspace AI datasets and Canvas
- ์ฟ ํก ๋ฐ์ดํฐ ํ๋ซํผ์ ์งํ
- ๋ฐ์ดํฐ ํ๋ซํผ ๊ตฌํ ์ฌ๋ก
- When your data doesnโt fit in memory: the basic techniques
- Top 5 must-have Data Science skills for 2020
- ์์ฐจ ํจํด ๋ง์ด๋์ ํ์ฉํ EHR ๋ถ์ โ 1ํธ
- ์์ฐจ ํจํด ๋ง์ด๋์ ํ์ฉํ EHR ๋ถ์ โ 2ํธ
- ๋ฐ์ดํฐ์ฌ์ด์ธ์ค ์ทจ์ ์ ์ ๊ผญ ๊ณ ๋ฏผํ๋ฉด ์ข์ ๋ด์ฉ ๊ณต๊ฐ!
- ๋ค์ ์ฐพ์๊ฐ ์งํ์ ์ธ๊ณ vanity metrics, actionable metrics
- 3 Design Principles for Engineering Data
- ๋ฐ์ดํฐ๋ถ์๊ฐ๋ก์ ์ ๋ฌด ๊ณผ์ ๊ณผ ๊ฒฝํ, ๋ฐฐ์์ ๊ณต์ ํฉ๋๋ค - ์ฐ์ํํ์ ๋ค ๊ธฐ์ ๋ธ๋ก๊ทธ
- ์ ๋ก๋ฒ ์ด์ค ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ | ์ง๋ฌด ์ธํฐ๋ทฐ โข ํ์ง ๋ค์ด๋ฒ ๊ณ์ด์ฌ ๋ฐ์ดํฐ ๋ถ์๊ฐ๊ฐ ๋งํ๋ โ๋ฐ์ดํฐ ๋ถ์๊ฐ์ ์ผโ | zero-base
- ์ปฌ๋ฆฌ์์ ๋ฐ์ดํฐ ๋ถ์๊ฐ๋ก ์ผํ๋ค๋ ๊ฒ - ์ปฌ๋ฆฌ ๊ธฐ์ ๋ธ๋ก๊ทธ ์๊ตฌ์ฌํญ์ ๋ํ ์ด์ผ๊ธฐ๊ฐ ์ธ์์ , ๋ง์ ๋ฆ
- Becoming A Data Analyst: Step by Step Guide - YouTube
- ๋ฐ์ดํฐ๋ถ์๊ฐ์ ๋ถ์ํฌํธํด๋ฆฌ์ค๋ง๋ค๊ธฐ ยท Present
- interview ์์ด๋์ด์คํ์ด ๋ฐ์ดํฐ๋ก ์ผํ๋ ๋ฐฉ๋ฒ. ์์ด๋์ด์คํ์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ผ๋ก ์ผํ๋ ๋ฌธํ๋ฅผ ํจ๊ป ๋ง๋ค์ด๊ฐ๊ณ ์๋โฆ | by Saeyeon Park | idus-Tech | Mar, 2022 | Medium
- IT ํ์ฌ์์ ๋ฐ์ดํฐ ์ง๊ตฐ์ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ๊ด๋ฆฌํ ๊น?
- Data Science Life Cycle 101 for Dummies like Me | by Sangeet Moy Das | Towards Data Science
- ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ ๊ทํ ํ๋ ์ด์ : ๋ค์ด๋ฒ ๋ธ๋ก๊ทธ
- Quantified Self Part 6 - ์์ฐ์ ์ธ ํ๋ฃจ์ ๋ํ ์ ๋์ ์ธ ํํ๊ณผ 4๋ ๊ฐ์ ๋ฐ์ดํฐ ์ด์ผ๊ธฐ - HumanBrain
- Almost Everything You Need To Know on Data Discovery Platforms
- What Is Data Engineering and Is It Right for You? โ Real Python realpython post์ง๋ง python์ด ์๋๋ผ generalํ ๊ธ
- Data Experience Report ๋ชจ์
- The Top 5 Data Trends for CDOs to Watch Out for in 2021 | by Prukalpa | Jan, 2021 | Towards Data Science
- 9 Distance Measures in Data Science | Towards Data Science
- The Future of Data Engineering
- ๐๊ฐ๋ฐ์ ํ์ํ ๋ฐ์ดํฐ ๊ตฌํ๊ธฐ #fetch - YouTube
- ์ข์ ๋ถ์ํ๊ฒฝ์ ๊ณต์ง๊ฐ ์๋๋ค
- Causal design patterns for data analysts | Emily Riederer
- Design patterns every data engineer should know | by Raj Samuel | Jan, 2022 | Medium
- 1๋ถ: ์คํ๋ฒ ์ค DT ์์ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ ๊ฐ์ฑ๋ถ์ โ SPH
- ๋จธ์ ๋ฌ๋ ๋น์ง๋ํ์ต์ผ๋ก ์ฐพ์ ์ต์ ์ ์คํ๋ฒ ์ค DT, TOP 4 ! โ SPH
- ๋จธ์ ๋ฌ๋ ์ง๋ํ์ต์ ํตํด์ ๊ผฝ์๋ณธ ์ต์ ์ ์คํ๋ฒ ์ค DT ์ฅ์!? โ SPH
- โ๋ฐ์ดํฐ ๋ญ๊ธ๋งโ ๋ฐ โํ๊ตฌ ๋ฐ์ดํฐ ๋ถ์โ ๋ฐ๋ผ์ก๊ธฐ - CIO Korea
- ๊ธ๋ก๋ฒ ์นผ๋ผ | ๋ฐ์ดํฐ ๋ญ๊ธ๋ง์ ๋นํํด์ ์ ๋๋ ์ด์ - ITWorld Korea
- ์นผ๋ผใ ฃ๊ฒฐ์ฝ ํ์ฐฎ์ง ์๋ค!ยทยทยท '๋ฐ์ดํฐ ๋ญ๊ธ๋ง' ์์ ์ด ๊ฐ์น ์๋ ์ด์ - CIO Korea
- ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ๋ซํผ : ๋ค์ด๋ฒ ๋ธ๋ก๊ทธ
- ๊น์ง์ฒ ์ How-to-Big Data | How-to-Big Data ํต์ฌ ์ ๋ฆฌ(Key Takeaways) (1) - CIO Korea
- ์ธ๋ฏธ๋ ํ๊ธฐ Wanted Con. Data ์์ฆ ๋ฐ์ดํฐ ํ์ ์ด๋ป๊ฒ ์ผํ ๊น?
- How to structure a data team to climb the pyramid of Data Science | Airbyte
- ๊ฒ์ ์ ์์ฅ์ ๋ค์ฌ๋ค๋ณด๊ธฐ ์ํ ๋จ ํ๋์ ์งํ
- Why and how should you learn โProductive Data Scienceโ? - KDnuggets
- The Quick and Dirty Guide to Building Your Data Platform | by Barr Moses | Jul, 2021 | Towards Data Science
- ๋ฐ์ดํฐ ํ๋ซํผ 2022: ํํ๋ฐ์ดํธ ๊ท๋ชจ์ ๊ธ๋ก๋ฒ ํ์ฅ. ์ฟ ํก ๋ฐ์ดํฐ ํ๋ซํผ์ ๋ฐ์ดํฐ ์ธ์ ์ค์ฒ(Ingestion), ๋จธ์ ๋ฌ๋โฆ | by ์ฟ ํก ์์ง๋์ด๋ง | Coupang Engineering Blog | Medium
- ๋ฐ์ดํฐ ํ๋ซํผ 2022: ๋ฐ์ดํฐ๋ฅผ ๋น์ฆ๋์ค ์ธ์ฌ์ดํธ๋กย ์ ํํ๊ธฐ | ์ฟ ํก ์์ง๋์ด๋ง | Coupang Engineering Blog
- Big Data World, Part 1: Definitions | JetBrains News
- ๋น ๋ฐ์ดํฐ์ ์ธ๊ณ, 2๋ถ: ์ง๋ฌด | JetBrains News
- ๋น ๋ฐ์ดํฐ์ ์ธ๊ณ, 3๋ถ: ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ | JetBrains News
- ๋น ๋ฐ์ดํฐ์ ์ธ๊ณ, 4๋ถ: ์ํคํ ์ฒ | JetBrains News
- Building a Scalable Data Science Pipeline at REA โข Justin Hamman & Jack Low โข YOW! 2019 - YouTube
- Big Data World, Part 5: CAP Theorem | JetBrains News
- ํ๋ ์ ๊ฒฝ๊ณผํ์ ๊ณผ์ฐ ๋ํค์ฝฉ์ ์ดํดํ ์ ์๋๊ฐ (2016) | GeekNews ๊ธฐ์ ์ ์ผ๋ก ๊ด๋ จ์ด ์๋ ๊ฑด ์์ง๋ง ์์ฌ์ ์ด ์์
- Why MapReduce is making a comeback โ Estuary
- ์ค๋์์ง ๋ฐ์ดํฐ ๋ง์ผํ ํ์ฉ๋ฒ : ์ ์ ๊ธฐ์ฌ ๋ถ์ ์์คํ - ์ค๋์์ง ๋ธ๋ก๊ทธ
- ์์ง์ ๋ฐ์ดํฐ๋ฅผ ํ๋ณํ๋ 5๊ฐ์ง ๋ฐฉ๋ฒ :ย ๋ฐ์ดํฐ ์์ ์ถฉ๋ถํ๊ฐ? | ์์ฆIT
- Log-based Change Data Capture โ lessons learnt | by Andreas Buckenhofer | Daimler TSS Tech | Medium Debezium, DynamoDB Streams, VoltDB
- ๋ฐ์ดํฐ ๋ถ์์ ํ์์ ์ธ 5 ๊ฐ์ง ๋ง์ธ๋
- ์ ๋ฌด ์ง์๋ ๋ชจ๋ฅด๋ฉด ๋ฐ์ดํฐ ๋ถ์์ ํ ์ ์๋ค๏ผ
- ์ ๋ฌด ์ง์๋ ๋ชจ๋ฅด๋ฉด ๋ฐ์ดํฐ ๋ถ์์ ํ ์ ์๋ค! 2
- ์ ๋ฌด ์ง์๋ ๋ชจ๋ฅด๋ฉด ๋ฐ์ดํฐ ๋ถ์์ ํ ์ ์๋ค! 3
- ์ ๋ฌด ์ง์๋ ๋ชจ๋ฅด๋ฉด ๋ฐ์ดํฐ ๋ถ์์ ํ ์ ์๋ค! 4
- ๊ธ๋ก๋ฒ ์นผ๋ผ | โ๋จธ์ ๋ฌ๋์ ๋ง๋ฅ์ด ์๋๋คโ ML ๋์ SQL ์ฟผ๋ฆฌ๋ฅผ ์จ์ผํ๋ ์ด์ - ITWorld Korea
- ์นผ๋ผใ ฃ๋จธ์ ๋ฌ๋์ ์ฒซ ๋ฒ์งธ ๊ท์น์ ML ์์ด ์์ํ๋ ๊ฒ์ด๋ค - CIO Korea
- ๋ชจ๋ธ๋ง ์ ๋ง๋ค๋ฉด ๋?ยทยทยท ๋ฐ์ดํฐ ๊ณผํ์ ์ํ โCI/CDโ๊ฐ ํ์ํ๋คย - CIO Korea
- Five Predictions for the Future of the Modern Data Stack | by Jordan Volz | Medium
- Modern Data Stack for Startups. โUse the right tool for the job!โ | by cyber-venom003 | Nybles | Medium
- Data Engineering: Major Technologies To Learn In 2022 | by Chandan Kumar | Jan, 2022 | Medium
- The Future of Data Engineering
- Roadmap to a Successful Data Engineer - Rock the JVM Blog
- ์นด์ฐ๋ ํฐ B์ปท ์ค๋์ฌํด ๋ฐ์ดํฐ๋ฅผ ๊ณต๊ฐํฉ๋๋ค - alookso
- Foundational Infrastructure to Create a Successful Data Science Team | PyData Global 2021 - YouTube
- Bridging Data and Business - Sylvia Lee | PyData Global 2021 - YouTube
- 2021๋ ๊ฐํธ๋ Data Science hype graph์ ๋ฑ์ฅํ ์ฉ์ด๋ค โ Cojette (๊ผฌ์ ฏ) โ ์ก๋ ์์ฌ ๋ฐ์ดํฐ ๋ถ์๊ฐ์ ์ด๊ฒ์ ๊ฒ ๊ธฐ์ ์ ์ธ ์ด์ผ๊ธฐ๋ ์๋์ง๋ง ๋ด๋๋งํจ
- The Importance of Ratios & KPIs in Data Science | by Christianlauer | CodeX | Feb, 2022 | Medium
- ๋ฐ์ดํฐ ์คํ์์์ ์คํ์ย ํธํฅ โ Cojette (๊ผฌ์ ฏ) โ ์ก๋ ์์ฌ ๋ฐ์ดํฐ ๋ถ์๊ฐ์ ์ด๊ฒ์ ๊ฒ
- SEF2021 ๋น ๋ฐ์ดํฐ๊ฐ ๋๋์ฒด ๋ฌด์? ๋น ๋ฐ์ดํฐ ๋ถ์๊ฐ๋ ๋ ๋ฌด์? - YouTube
- ๋ธ๋ฐ์น๋ถ ์จ๋ผ์ธ์๋น์ค๋ฅผ ์ํ ๋ฐ์ดํฐ์ฌ์ด์ธ์ค
- 7 Must-Know Data Buzzwords in 2022 | by Coco Li | Kyligence | Jan, 2022 | Medium
- Data Management Trends You Need to Know - Gradient Flow
- What is Data as a Service?. How the new Paradigm will make yourโฆ | by Christianlauer | Apr, 2022 | Medium
- ๋ฐ์ดํฐ ๋ถ์๊ฐ ๋๋๊ฐ ์ ์๋ ์ถ๊ตฌ ํ๋ ์คํ๊ธฐ
- Week 1 - What is advanced data science anyway?
- ๋ฐ์ดํฐ ๋ถ์์ ํ์ํ ์์ง์ ๋ญ๊น? | Popit
- ๋ฐ์ดํฐ ์คํ ๋ฆฌํ ๋ง ์ฐ์ต! Day3
- Data Is An Art, Not Just A ScienceโAnd Storytelling Is The Key โ Data Science & Engineering (2022)
- There's no such thing as data โ Benedict Evans
- ์นด์นด์คํ์ด ์ ์ ํ๋กํ์ผ๋ง, ํ์ดํ๋กํ์ผ | Kakao Pay Tech
- Data Versioning for Modern Data Teams and Platforms | by Christianlauer | CodeX | Jul, 2022 | Medium
- ๋ฐ์ดํฐ์ ์ ๋ขฐ์ฑ๊ณผ ์ฌ์ฌ์ฉ์ฑ๊น์ง, Analytics Engineering with dbt - SOCAR Tech Blog data build tool
- Typical Problems and Challenges in Data Science | by Christianlauer | CodeX | Aug, 2022 | Medium
- DataFest Seoul ๋ฐํ์๋ฃ
- 2022 ์นด์นด์ค ์ฑ์ฉ์ฐ๊ณํ ๊ฒจ์ธ ์ธํด์ญ for Tech Developers์ ์งํํฉ๋๋ค! โ tech.kakao.com
- ๋น ๋ฐ์ดํฐ๋ก ์ดํด๋ณธ 'ํ์๋๋' : (1) ์์ํธ
- ๋น ๋ฐ์ดํฐ๋ก ์ดํด๋ณธ 'ํ์๋๋' : (2) ๊ณต๊ธํธ
- ๋น ๋ฐ์ดํฐ๋ก ์ดํด๋ณธ 'ํ์๋๋' : (3) ์ข ํฉํธ
- ์ปฌ๋ฆฌ๋ ๋ฌผ๋ฅ ์ต์ ํ ๋ฌธ์ ๋ฅผ ์ด๋ป๊ฒ ํ๊ณ ์์๊น? - 1๋ถ - ์ปฌ๋ฆฌ ๊ธฐ์ ๋ธ๋ก๊ทธ
- ์ปฌ๋ฆฌ๋ ๋ฌผ๋ฅ ์ต์ ํ ๋ฌธ์ ๋ฅผ ์ด๋ป๊ฒ ํ๊ณ ์์๊น? - 2๋ถ - ์ปฌ๋ฆฌ ๊ธฐ์ ๋ธ๋ก๊ทธ
- 60. ๋ฐ์ดํฐ์ฌ์ด์ธ์ค ์-ํฌ์ธํธ๋ ์จ
- Elena Dyachkova on Twitter: "Data folks, thoughts on this title overlap illustration? https://t.co/xe41a4JZJz" / Twitter ๊ฐ ์ญํ ์ด ์ด๋ป๊ฒ ๊ฒน์น๋์ง diagram์ผ๋ก ํํ
- Python vs. SQL in Data Science | 01
- ๊ณตํ์ ๊ด์ ์ผ๋ก ๋ฐ์ดํฐ ๋ถ์ ํ๋ก์ธ์ค ๋ง๋ค๊ธฐ. ๋น๊ทผ๋ง์ผ ๋ฐ์ดํฐ ๋ถ์ ํ๋ก์ธ์ค ๊ฐ์ ๊ธฐ | by Theo | ๋น๊ทผ๋ง์ผ ํ ํฌ ๋ธ๋ก๊ทธ | Apr, 2023 | Medium
- ํ๋๊ธ์ต๊ฒฝ์์ฐ๊ตฌ์
- DMOps(Data Management Operation and Recipes), ํ์ ์์ ๋ฐ์ดํฐ ๊ตฌ์ถํ๊ธฐ โ Upstage
- ๋ฐ์ดํฐ๋ก ์ฝํ ์ธ ์ ๋๋ก ๋ค๋ฃจ๊ธฐ. ์ค๋์ ์ฝํ ์ธ ์ค์ฟผ๋์ ์ผ์์ผ๋ก์ ํ๊ณ ์๋ 29CM ์ฝํ ์ธ ๋ฐ์ดํฐโฆ | by ๊น๋์ฑ | 29CM TEAM | May, 2023 | Medium
- Uplift Modeling. Maximizing the incremental return ofโฆ | by Barฤฑล Karaman | Towards Data Science
- 100+ ํ์์ ์์ฌ๊ฒฐ์ ์ ์ํฅ์ ์ฃผ๋ Data Scientist, Decision | by matthew l | ๋น๊ทผ๋ง์ผ ํ ํฌ ๋ธ๋ก๊ทธ | Jul, 2023 | Medium test ๊ด๋ จ ์ข์ ๊ธ
- Practical advice for analysis of large, complex data sets
- Vin Vashishta on LinkedIn: #data #analytics #datascience #consulting | 698 comments data์ ๋ํ ์ฌ๋ฏธ์๋ ์ฌ์ง
- ๊ณตํต ๋ฐ์ดํฐ ์ธ์ด ๊ตฌ์ถ ๊ธฐ๋ฐ โ์๋งจํฑ ๋ ์ด์ดโ < ๋น์ฆ๋์ค ์ธ์ฌ์ดํธ < ITยท์ฐ์ < ๋ด์ค < ๊ธฐ์ฌ๋ณธ๋ฌธ - ์งํฐํฐ์ฝ๋ฆฌ์
- ์์ธก ๋ชจ๋ธ ๋งํฌ์ ์ธ์ด โPMMLโ...๊ธฐ์ ๋ฐ์ดํฐ ํ์ฉ ์ต๋ํ < ๋น์ฆ๋์ค ์ธ์ฌ์ดํธ < ITยท์ฐ์ < ๋ด์ค < ๊ธฐ์ฌ๋ณธ๋ฌธ - ์งํฐํฐ์ฝ๋ฆฌ์
- ๋ง์ด๋ฐ์ดํฐ ํ๋ซํผ์ ๋์ฉ๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๊ฐ์ ! ๊ตฌ๊ฒฝ ํ๋ฒ ํด๋ณผ๋? | ์นด์นด์คํ์ด ๊ธฐ์ ๋ธ๋ก๊ทธ
- ์์คํ ํธ๋ ์ด๋ฉ์ ์ํ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค (ํ์ด์ฌ ํ์ฉํธ)
- ๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฐ์ดํฐ ๊ณผํ
- ๋๋ถ(TheBook): ๋ชจ๋์ ๋ฐ์ดํฐ ๊ณผํ with ํ์ด์ฌ 3~5์ฅ๋ง
- ๋๋ถ(TheBook): ๋ชจ๋์ ๋ฐ์ดํฐ ๋ถ์ with ํ์ด์ฌ
- ์ถ์ฒ ์์คํ | ์์ด์ฝ์ถํ์ฌ
- ํ์ด์ฌ์ ํ์ฉํ ๋ฐ์ดํฐ/AI ๋ถ์ ์ฌ๋ก ๊ฑด๊ฐ๋ณดํ์ฌ์ฌํ๊ฐ์์์ ๋ง๋ "ํ์ด์ฌ์ ํ์ฉํ ๋ฐ์ดํฐ/AI ๋ถ์ ์ฌ๋ก"
- 12 Data Analytics Books for Beginners: A 2022 Reading List | Coursera
- 27 free data mining books
- Foundations of Data Science
- The Data Science Handbook
- 16 Free Data Science Books
- Free Data Science Books
- 50+ Free Data Science Books
- 60+ Free Books on Big Data, Data Science, Data Mining, Machine Learning, Python, R, and more
- Welcome to the School of Data Handbook
- The Data Science Handbook
- The Data Analytics Handbook
- Reading for Growing Data Engineersโโโ2017
- Data Science at the Command Line
- List of Must โ Read Free Data Science Books
- Learning Data Science: Our Favorite Data Science Books
- The Elements of Data Analytic Style
- Executive Data Science
- Data Analysis for the Life Sciences
- Data-Engineering-with-Python: Data Engineering with Python, published by Packt
- Statistical inference for data science
- Essays on Data Analysis
- Advanced Linear Models for Data Science
- Introduction to Data Science
- The Best Free Books for Learning Data Science
- The Data Engineering Cookbook
- Great Books for Data Science
- ๋ธ๋ฐ์น๋ถ ๋ฐ์ดํฐ ๊ณผํ ๋ฏธ๋๋ถ
- Efficient Python Tricks and Tools for Data Scientists โ Effective Python for Data Scientists
- Free Book: Foundations of Data Science (from Microsoft Research Lab) - DataScienceCentral.com
- PDA_Book: Code Examples Data Science using Python
- Python for Data Analysis, 3E
- David Aronchick - Revolutionizing the Big Data Age With Compute over Data | PyData Global 2022 - YouTube
- ๋ฐ์ดํฐ์ผ๋์(2022) - ๋ฐ์ดํฐ๋ก ํ ์ด ์๋น์ค๋ง๋ค๊ธฐ ยท Present google sheets, telegram chatbot, pandas dataframe, airflow
- ๋ฐ์ดํฐ์ผ๋์2021 ๋ฐ์ดํฐ์ ํจ๊ปํ๋ ๋๋ํ ์ค๊ณ ๊ฑฐ๋ - ์ผ๋ฐ์ค๋ฐฑ๋ - YouTube
- ๋ฐ์ดํฐ์ผ๋์2021 ๊ณต๊ณต๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์์ธ์ ๊ณต/์ฌ๊ต์ก ๋ถ์ - ๊ณ ๋์ฐ(๋ฐ์ดํฐ๋๋ฆผ)๋ - YouTube
- Agile Data Science - John Sandall | PyData Global 2021 - YouTube
- ๋ฐ์ดํฐ๋ก ํธ๋ ๋ ์ฝ๋ ๋ฐฉ๋ฒ | NHN FORWARD
- Taming the Data Mess, How Not to Be Overwhelmed by the Data Landscape - YouTube
- A Recap of the Data Engineering Open Forum at Netflix | by Netflix Technology Blog | Jun, 2024 | Netflix TechBlog
- SOCAR DATA MeetUp 2022 - YouTube
- Phillip Cloud & Gil Forsyth - Ibis: A fast, flexible, and portable tool for data analytics - YouTube
- ์๊ฐ๋ฃ 500๋ง์ ๋ฐ์ดํฐ์ฌ์ด์ธ์ค ์ค์ฟจ ์ปค๋ฆฌํ๋ผ์ ๋์ฒดํ๋ ์จ๋ผ์ธ ๋ฌด๋ฃ๊ฐ์ 15๊ฐ ์ปค๋ฆฌํ๋ผ
- ํต๊ณํ, ์ ํ๋์ํ, numpy, ๊ฒ์ ๋ฐ ์ถ์ (ํ๋ฅ ๋ก ), machine learning, database, ๋ฐ์ดํฐ ์๊ฐํ, ๋ฐ์ดํฐ ๋ถ์, deep learning
- ๋ชจ๋๋ฅผ ์ํ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ๊ฐ์ข์๊ฐ : ๋ถ์คํธ์ฝ์ค
- Review: Udacity Data Analyst Nanodegree Program
- I Dropped Out of School to Create My Own Data Science MasterโsโโโHereโs My Curriculum
- Learn Data Science in 3 Months
- Our 25 Favorite Data Science Courses From Harvard To Udemy
- pubdata.tistory.com/category/Lecture_DataMining
- Nonnegative Matrix Factorization via Rank-One Downdate
- 5 Bite-Sized Data Science Summaries
- 5 Online Data Science Courses You Can Finish in 1 Day | by Sara A. Metwalli | Aug, 2021 | Towards Data Science
- The online courses you must take to be a better Data Scientist | DataTau
- Data-Science-For-Beginners: 10 Weeks, 20 Lessons, Data Science for All!
- Dev Intro to Data Science - YouTube
- Practical Data Ethics | Data ethics
- Free Data Science for Beginners curriculum on GitHub - DEV Community
- Data Analytics Full Course 2022 | Data Analytics For Beginners | Data Analytics Course | Simplilearn - YouTube
- 5 Best Python Courses For Data Science Beginners in 2022 - Best of Lot
- Data Science Grandmaster Series - YouTube
- 12 Best+FREE Data Engineering Courses Online & Certifications- 2022
- ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ โ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ค์ฟจ
- The Simple Yet Practical Data Cleaning Codes To solve the common scenarios of messy data
- sampleclean - Data Cleaning With Algorithms, Machines, and People
- The Ultimate Guide to Data Cleaning
- Quick Guide: Steps To Perform Text Data Cleaning in Python
- Steps for effective text data cleaning (with case study using Python)
- The Art of Cleaning Your Data
- Cleaning and Tidying Data in Pandas || Daniel Chen
- Top 10 data mining algorithms in plain English
- Statistical Data Mining Tutorials
- Data Mining and Statistics: What's the Connection?
- Introduction to Data Mining
- Difference between classification and clustering in data mining?
- OPENDATAMINER - THE DATA MINING COMPANY THAT TURNS YOUR DATA INTO VALUES
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ - RomanticQ์ ๋จธ์ ๋ฌ๋
- ํ ์คํธ ๋ง์ด๋ ๊ธฐ๋ฒ - RomanticQ์ ๋จธ์ ๋ฌ๋
- ํ ์คํธ ๋ง์ด๋ ๊ธฐ๋ฒ2 - RomanticQ์ ๋จธ์ ๋ฌ๋
- ํ ์คํธ ๋ง์ด๋ ๊ธฐ๋ฒ3 - RomanticQ์ ๋จธ์ ๋ฌ๋
- knime.com
- "๊ฐ์, ๋ฐ์ดํฐ์ ์ธ๊ณ๋ก" ๋ฌด๋ฃ ์ ๋๋ฆฌํฑ์ค ํด 7์
- Comparison of top data science libraries for Python, R and Scala Infographic
- 10 Data Science Tools I Explored in 2018 - New Languages, Libraries, and Services
- 2018โs Top 7 Libraries and Packages for Data Science and AI: Python & R - This is a list of the best libraries and packages that changed our lives this year, compiled from my weekly digests
- The Five Best Frameworks for Data Scientists
- Learn Data Engineering: My Favorite Free Resources For Data Engineers
- Interactive Tools for ML, DL and Math
- Top 38 Python Libraries for Data Science, Data Visualization & Machine Learning - KDnuggets
- 10 Essential Tools Data Scientists Should Learn in 2022 | by javinpaul | Javarevisited | Jan, 2022 | Medium
- academictorrents.com
- Airbyte | Open-Source Data Integration Pipelines To Your Warehouses
- Announcing FsLab: Data science package
- Beaker
- chatbot-reviewrate-compare: ๋ค์ด๋ฒ/์นด์นด์ค/๊ตฌ๊ธ ๋ง์ง ํ์ ์ ๋น๊ตํด์ฃผ๋ ์ฑ๋ด์ ๋๋ค
- danfojs: Danfo.js is an open source, JavaScript library providing high performance, intuitive, and easy to use data structures for manipulating and processing structured data
- Pandas๋ฅผ ์๋ฐ์คํฌ๋ฆฝํธ์์! Danfo.js - YouTube
- Danfo.js | ์ฌ๋ฏธ์๋ ๊ธฐ์ต๋ง ๋จ๊ธฐ์
- Danfo.js์ ๊ดํ ๊ณต๋ถํ ๋ด์ฉ ์ ๋ฆฌ
- JavaScript์์๋ pandas ๊ฐ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ? Danfo.js๋ฅผ ์๊ฐํฉ๋๋ค.
- Introducing Danfo.js, a Pandas-like Library in JavaScript โ The TensorFlow Blog
- Danfo.js: A Pandas-like Library for JavaScript
- Dataflow Data pipeline asset management with Dataflow | by Netflix Technology Blog | Netflix TechBlog
- Datasette: An open source multi-tool for exploring and publishing data
- dataverse: The Universe of Data. All about data, data science, and data engineering
- datools a collection of Python-based tools for working with data in relational databases
- dbt - Transform data in your warehouse
- Decodable
- Digdag - a simple tool that helps you to build, run, schedule, and monitor complex pipelines of tasks Data Workflow Management Opensource Engine
- faker.js: generate massive amounts of realistic fake data in Node.js and the browser
- GRID - Global Research Identifier Database Cataloging the world's research organisations
- HEARTCOUNT ๋ชจ๋ ํ์ ์ ์ํ ๋ฐ์ดํฐ ๋ถ์ ์๋ฃจ์ :: ํํธ์นด์ดํธ HEARTCOUNT
- koheesio: Python framework for building efficient data pipelines. It promotes modularity and collaboration, enabling the creation of complex pipelines from simple, reusable components
- Metaflow - A framework for real-life data science
- ๋ฐ์ดํฐ๊ณผํ ํ๋ก์ ํธ์์, ๋ชจ๋ธ ๊ฐ๋ฐ ์ธ์ ์ธ "์ธํ๋ผ" ์ ์ธ ์์๋ฅผ ๊ด๋ฆฌํ๋ ๋๊ตฌ
- Job ์ค์ผ์ค๋ง, ํ๋ก์ฐ ์์๋ณ ๋ฒ์ ๊ด๋ฆฌ์ ๊ฒฐ๊ณผ์ ๋ํ Inspecting, ํ๋ก์ฐ ๋ฐ ํ๋ก์ฐ ์์๋ณ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์์กด์ฑ ์ฃผ์ , Amazon S3์ ๋ํ built-in ์ง์, ์ปดํจํ ์์์ ๋ํ ์์ฌ์ด ์ค์ผ์ผ ์ธ/์์ ๋ฑ์ ๊ฐ๋ฅ
- ๊ธฐ๋ณธ์ ์ผ๋ก ํ๋ก์ฐ๋ ๊ทธ๋ํ ํํ๋ก, ๊ทธ ํ์ดํ๋ผ์ธ์ ์ฐ์์ฑ์ด ์ฐ๊ฒฐ๋์ด, ์ด๋ค ํํ๋ผ๋ ํ๋ก์ฐ๊ฐ ํ๋ฌ๊ฐ๋ ํ์์ ๊ตฌ์ ๊ฐ๋ฅ
- ๋ชจ๋ ํ๋ก์ฐ์ ๋ชฉ๋ก์ ์ฑ๊ธํค์ ์ธ ๊ฐ์ฒด์ ์ํด์ ๊ด๋ฆฌ
- ์ผ๋จ ํ๋ก์ฐ๊ฐ ์์ฑ๋๋ฉด, ์ํ๋ ์ด๋ค ํ๊ฒฝ(์ฃผํผํฐ ๋ ธํธ๋ถ, IDE๋ฑ) ์์๋ ์ ๊ทผ ๊ฐ๋ฅ
- ์ถ๊ฐ์ ์ผ๋ก, ํ์ผ (๋ก์ปฌ ๋๋ S3) ๋ฐ ์คํ์ ์ฌ์ฉ๋๋ ๋ค์ํ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ธ๋ง ํด๋๊ณ , ๊ฐ์ CLI๋ก ํ๋ก๊ทธ๋จ ์คํ์ ์ฃผ์ ํด์ฃผ๋๊ฒ๋ ๊ฐ๋ฅ
- ํ๋ผ๋ฏธํฐ๋ ๋ฐ์ดํฐ ์ฒ๋ผ ํ์ผ๋ก ๊ด๋ฆฌํด์ ๋ฒ์ ๊ด๋ฆฌ๊ฐ ๊ฐ๋ฅ
- ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํ์์ผ๋ก ๋ง๋ค์ด์ก์ง๋ง, ์์ฆ ์ถ์ธ์ฒ๋ผ annotation ํํ๋ก ๊ธฐ๋ฅ ์ ์ํ๋ ๋ฐฉ์ ์ง์
- ์๋ฅผ ๋ค์ด, ํ๋ก์ฐ์ ๊ฐ ๋จ๊ณ์ค์ ์ @step, ํ๋ก์ฐ ๋จ์์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์์กด์ฑ ์ฃผ์ ์ @conda_base, ํ๋ก์ฐ ์์๋ณ { ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์์กด์ฑ ์ฃผ์ ์ @conda, ์์์ ํฌ๊ธฐ์ค์ ์ @resource, AWS ๋ฐฐ์น๋จ์ ์์ ํฌ๊ธฐ์ค์ ์ @batch, ๋จ๊ณ ์คํจ์ ์ฌ์๋์ฌ๋ถ ์ค์ ์ @retry} ๋ฑ์ด ์กด์ฌ
- ๋ถ๊ฐ์ ์ผ๋ก, ํ๋ก์ฐ์ ๋จ๊ณ(์์)๋ ๊ฐ๊ฐ ๋ฒ์ ์ด ์ปจํธ๋กค ๋๊ธฐ ๋๋ฌธ์, ๊ฐ ๋จ๊ณ๋ณ ๊ฒฐ๊ณผ๋ฅผ ์กฐํฉํด์ ๋ค์์คํ์ด์ค๋จ์๋ก ๋ฌถ๋๊ฒ๋ ๊ฐ๋ฅ
- ์ํ๋ ์คํ ๋จ๊ณ์ ๊ฒฐ๊ณผ๋ฅผ ์กฐํฉํด์ ๋ถ์ ๊ฐ๋ฅ (tagging๋ ๊ฐ๋ฅ)
- MetaFlow๋ ๊ธฐ๋ณธ์ ์ผ๋ก, "first class support for various services on AWS" ์ธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ. Amazon S3์ ๋ฐฐํฌํ๋ ํํ ๋ฆฌ์ผ๋ ์ ์์ฑ
- How Metaflow Became Netflix's Beloved Data Science Framework โข Julie Amundson โข YOW! 2022 - YouTube
- Mirador is a tool for visual exploration of complex datasets
- Mockaroo - Mockaroo lets you generate up to 1,000 rows of realistic test data in CSV, JSON, SQL, and Excel formats
- Mode - Analyze raw or modeled data with SQL, Python, or R without moving between different tools
- nf-data-explorer: The Data Explorer gives you fast, safe access to data stored in Cassandra, Dynomite, and Redis
- Piwik - Open Analytics Platform
- Psyberg
- Psyberg: Automated end to end catch up | by Netflix Technology Blog | Nov, 2023 | Netflix TechBlog
- Streamlining Membership Data Engineering at Netflix with Psyberg | by Netflix Technology Blog | Nov, 2023 | Netflix TechBlog | Netflix TechBlog
- Diving Deeper into Psyberg: Stateless vs Stateful Data Processing | by Netflix Technology Blog | Nov, 2023 | Netflix TechBlog
- quary: Open-source BI for engineers
- Velox Hello from Velox | Velox
- Introducing Velox: An open source unified execution engine
- Meta์์ ๋ฐ์ดํฐ ๊ด๋ฆฌ ์์คํ ์ ๊ฐ์ํํ๊ณ ๊ฐ์ํํ๋ ํตํฉ ์คํ ์์ง Velox๋ฅผ ์คํ์์ค๋ก ๊ณต๊ฐ
- presto, Spark, PyTorch ๋ฑ ๋ง์ ๋ฐ์ ์ด ์์์ง๋ง ์ฌ๋ฌ ์์คํ ๊ฐ์ ์ํธ ์์ฉํด์ผ ํ๋ ์ด๋ ค์์ Meta ๋ด์์ Velox๋ก ํด๊ฒฐํ๊ธฐ ์ํด์ ๊ฐ๋ฐ
- Introducing Velox: An open source unified execution engine
- Weld: A common runtime for high performance data analytics
- Numba์ ๋น์ทํ๊ฒ, Rust ๊ธฐ๋ฐ ์ปดํ์ผ๋ฌ๋ฅผ ์ด์ฉํด Data ๋ถ์ ์คํฌ๋ฆฝํธ์ ์๋๋ฅผ ์ต์ ํํ์ฌ ๋น ๋ฅด๊ฒ ํจ
- ๋ด์ฉ์ ๋ฐ๋ฅด๋ฉด ํน์ ๋ฐ์ดํฐ ๋ถ์์ ๊ฒฝ์ฐ ์๋ ํฅ์
- Pandas, TensorFlow, Spark SQL๋ฑ ๊ฒฐํฉ ๊ฐ๋ฅ
- ๋ฐ์ดํฐ ๋์ค์ปค๋ฒ๋ฆฌ ํ๋ซํผ ๋์ ๊ธฐ - 1ํธ. ๋ฐ์ดํฐ ๋์ค์ปค๋ฒ๋ฆฌ๋?(feat. Datahub VS Amundsen ๋น๊ต ๋ถ์) - SOCAR Tech Blog
- ๋ฐ์ดํฐ ๋์ค์ปค๋ฒ๋ฆฌ ํ๋ซํผ ๋์ ๊ธฐ - 2ํธ. GKE์ Datahub ๊ตฌ์ถํ๊ธฐ - SOCAR Tech Blog
- DDP๋ฅผ ๋งํ ๋ ๊ฐ์ด ๊ณ ๋ คํด ๋ณผ ๊ฒ๋ค(1) โ Cojette (๊ผฌ์ ฏ) โ ์ก๋ ์์ฌ ๋ฐ์ดํฐ ๋ถ์๊ฐ์ ์ด๊ฒ์ ๊ฒ
- DDP๋ฅผ ๋งํ ๋ ๊ฐ์ด ๊ณ ๋ คํด ๋ณผ ๊ฒ๋ค(2) โ Cojette (๊ผฌ์ ฏ) โ ์ก๋ ์์ฌ ๋ฐ์ดํฐ ๋ถ์๊ฐ์ ์ด๊ฒ์ ๊ฒ
- DDP๋ฅผ ๋งํ ๋ ๊ฐ์ด ๊ณ ๋ คํด ๋ณผ ๊ฒ๋ค(3) โ Cojette (๊ผฌ์ ฏ) โ ์ก๋ ์์ฌ ๋ฐ์ดํฐ ๋ถ์๊ฐ์ ์ด๊ฒ์ ๊ฒ
- amundsen Data discovery & metadata management (amundsen installation)
- datahub A Metadata Platform for the Modern Data Stack | DataHub
- dbt - Transform data in your warehouse
- 19 Free Public Data Sets For Your First Data Science Project
- Fueling the Gold Rush: The Greatest Public Datasets for AI
- Awesome Public Datasets
- city of Chicago
- datalab.naver.com
- Open Data for Deep Learning
- Research data management simplified
- Welcome to Kaggle Datasets
- Creating a dataset using an API with Python
- Best Public Datasets for Machine Learning and Data Science
- awesome-data-and-analytics-governance: ๋ฐ์ดํฐ & ๋ถ์ ๊ฑฐ๋ฒ๋์ค ์ ๊ณ ๋ฅผ ์ํ ์์ง์ ๋ ํผ๋ฐ์ค๋ค์ ์์งํ๊ณ ์๊ฐ์ ๋๋ ์ ์์ต๋๋ค.
- Awesome Data Engineering Learning Path - Best resources, books, courses
- Awesome Data Science with Python
- awesome-ds-setting: Data science setting for a new machine
- github.com/PyDataKR/pydata.kr
- Hands-on Introduction to Spatial Data Analysis in Python
- Data Science for Losers
- Data Science for Losers, Part 2 โ Addendum
- The Guide to Learning Python for Data Science
- dprl - ์์ฌ๊ฒฐ์ (DP) + ๊ฐํํ์ต(RL) + ์จ๋ผ์ธ๊ด๊ณ (OA) + ํ์ด์ฌ์น(Pyweb)
- Infographic โ Quick Guide to learn Python for Data Science
- PyDataSentry - Memory for Data Science
- Unisex names โ Data Analysis Use Case
- A modern guide to getting started with Data Science and Python
- ๋น ๋ฐ์ดํฐ๋ฅผ ์ํ ํ์ด์ฌ(Python) ๊ต์ก ๋ด์ฉ ์ ๋ฆฌ
- Python for Data Science - Python Brasil 11 (2015)
- Machine Learning in Python has never been easier
- python-data-analysis
- Data Analysis with Python and Pandas
- Marco Bonzanini - Building Data Pipelines in Python
- Robson Junior - Mastering a data pipeline with Python: 6 years of learned lessons from mistakes - YouTube
- PyData Boston September 2023 session 1: Data sci done wrong: how & why data scientists make mistakes - YouTube
- Data manipulation primitives in R and Python
- How A Data Scientist Can Improve His Productivity
- Python์ผ๋ก Big Data ๋ถ์ํ๊ธฐ
- Neuroimaging_Python ๋ด๋กํดํน ํ์ด์ฌ ํํธ ์คํฐ๋ ๊ด๋ จ ์๋ฃ๋ฅผ ์ ์ฅ
- python4mri - Introduction to Python for neuroimaging (MRI) analysis
- ์ฐจ์ ์ถ์ (Principal Component Analysis)
- A Complete Tutorial on Ridge and Lasso Regression in Python
- Ridge์ Lasso Regression์ ์ฌ์ด ํ์ด
- Intro to Linear Model Selection and Regularization Understand how to select the best linear model, and understand what lasso and ridge regression do
- How to Perform Lasso and Ridge Regression in Python
- Fast group lasso in Python
- Predicting Football Results With Statistical Modelling
- 12 Python Resources for Data Science
- ํ์ด์ฌ ์ฝ๋ฉ์ผ๋ก ๋งํ๋ ๋ฐ์ดํฐ ๋ถ์
- 1. ํต๊ณ
- 2. ๋ฒ ์ด์ฆ ํ๋ฅ
- 3. ๊ตฐ์งํ
- 4. ์ฐ๊ด (Apriori ์๊ณ ๋ฆฌ์ฆ)
- 5. ๋ฐ์ดํฐ ๋ค๋ฃจ๊ธฐ (๊ธฐ๋ณธ,์ฒ๋์กฐ์ ,์ฐจ์์ถ์)
- 6. ๊ฒฝ์ฌํ๊ฐ๋ฒ
- 7. ํ๊ท๋ถ์ (์ต์์ ๊ณฑ๋ฒ,๊ฒฝ์ฌํ๊ฐ๋ฒ)
- 8. HMM ํ์ต๋ฌธ์ (Baum-Welch ์๊ณ ๋ฆฌ์ฆ)
- 9. k-NN (์ต๊ทผ์ ์ด์,๋ถ๋ฅ๋ฌธ์ )
- 10. DTW (Data time wrapping)
- The Python ecosystem for Data Science: A guided tour - Christian Staudt
- Analysing IPL Data to begin Data Analytics withย Python
- Python for Data Science: 8 Concepts You May Have Forgotten
- ๋๋ด๋ฅผ ์ค์ด๋ Data์ Feature ๋ค๋ฃจ๊ธฐ
- Python Data Science Handbook
- ์ผ๊ตฌ ๋ํ ๊ฐ๋จํ ๋ชจ๋ธ๋ง ์ฝ๋
- How to use Data Science to better understand your customers
- Aaron Richter: Your data fits in RAM: How to avoid cluster computing | PyData Miami 2019
- Data Science Toolkit (Concepts + Code) Jupyter, Numpy, Pandas, Plotly
- 10 Simple hacks to speed up your Data Analysis in Python
-
- Profiling the pandas dataframe dataframe ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ณ ์ ํ์์ผ๋ก
-
- Bringing Interactivity to pandas plots
-
- A Dash of Magic
-
- Finding and Eliminating Errors
-
- Printing can be pretty too
-
- Making the Notes stand out.
-
- Printing all the outputs of a cell
-
- Running python scripts with the โiโ option.
-
- Commenting out code automatically
-
- To delete is human, to restore divine
-
- ์ํ์งํฅ์ ๋ฐ์ค์คํผ์ค ์์ ๋ถ์
- Ondrej Kokes - High Performance Data Loss | PyData Fest Amsterdam 2020 - YouTube
- Data Science With Python | Python For Data Science | Data Science For Beginners | Simplilearn - YouTube
- python ๋ฐ์ดํฐ ๋ถ์ ์ค์ต ์ฝ๋ก๋ 19 2021 ํ์ฌ ์์ ๋ถ์ํ๊ธฐ 1ํธ
- 15 Python Snippets to Optimize your Data Science Pipeline - KDnuggets
- 5 ways for Data Scientists to Code Efficiently in Python
- Data scientistโs guide to efficient coding in Python | by Dr. Varshita Sher | Jul, 2021 | Towards Data Science
- Creating a Data Science Python Package Using Jupyter Notebook | by Abid Ali Awan | Jul, 2021 | Towards Data Science
- Why Python is best choice for Data Science? - DEV Community
- Python for Data Science - YouTube
- Analyzing Data with Python - YouTube
- 90+ Data Science Projects You Can Try withย Python | Python in Plain English
- A Guide to Getting Datasets for Machine Learning in Python
- Refactoring A Data Science Project Part 1 - Abstraction and Composition - YouTube
- Refactoring A Data Science Project Part 2 - The Information Expert - YouTube
- Refactoring A Data Science Project Part 3 - Configuration Cleanup - YouTube
- Ian Ozsvald - Building Successful Data Science Projects | PyData London 2022 - YouTube
- ๋ ์จ๋ง๋ฃจ ํ์ด์ฌ ๋ ์จ ๋ฐ์ดํฐ ๋ถ์ - YouTube
- Sebastiaan J. van Zelst: Process Mining in Python | PyData Eindhoven 2019
- Python Fundamentals For Data Engineering: Create your first ETL Pipeline - YouTube
- Python & Visual Studio Code - Revolutionizing the way you do data science - presented by Jeffrey Mew - YouTube
- Irina Klein - IMF Data Discovery and Collection | PyData Global 2022 - YouTube
- DEVOCEAN ๋ฉํ๋ถ์ - 1. ๋ฐ์ดํฐ ํ์
- Nick Radcliffe - Test-Driven Data Analysis in Python | PyData London 2024 - YouTube
- ๐ป๐ค ํ์ด์ฌ์ผ๋ก ์ฝ๊ฒ ๋ฐฐ์ฐ๋ ๋ฐ์ดํฐ ๋ถ์ - YouTube
- Any aspiring data scientist should know these Python libraries
- Top 15 Python Libraries for Data Science in 2017
- Top 15 Python Libraries for Data Science in 2017
- Lesser Known Python Libraries for Data Science
- 10 Simple hacks to speed up your Data Analysis in Python ์ฌ๋ฌ๊ฐ์ง ๋ถ์ผ(data, visualization๋ฑ)์ library
- Python ETL Tools: Best 8 Options
- ๋ฐ์ดํฐ ๊ณผํ์ ์ํด '๋ ๊ฐ์ ๋' ์ต์ ํ์ ํ์ด์ฌ ํด 6๊ฐ์ง - ITWorld Korea
- Accelerator ๋จ์ผ ์์คํ ์์ ํ ๋ผ๋ฐ์ดํธ ๋จ์์ ๋ฐ์ดํฐ๋ฅผ ๊ณ ์ ์ฒ๋ฆฌ๋ฅผ ํ๋๋ก ์ค๊ณ๋ eBay์์ ๊ฐ๋ฐํ ์คํ์์ค ํ๋ ์์ํฌ
- Amphi | Python-based ETL
- BlazingSQL(BSQL) GPU-accelerated SQL and Data Science - Rodrigo Aramburu - YouTube
- CC-hurricane-analysis-project: A simple project with several functions that organize and manipulate data about Category 5 Hurricanes
- dabl - the Data Analysis Baseline Library
- dagster: A data orchestrator for machine learning, analytics, and ETL
- Introducing Dagster. A open-source Python library forโฆ | by Nick Schrock | Dagster | Medium
- Dagster: The Data Orchestrator. As machine learning, analytics, andโฆ | by Nick Schrock | Dagster | Aug, 2020 | Medium
- Sandy Ryza - Data pipelines != workflows: orchestrating data with Dagster | PyData Global 2022 - YouTube
- datatable An Overview of Pythonโs Datatable package
- deep-daze: Simple command line tool for text to image generation using OpenAI's CLIP and Siren (Implicit neural representation network). Technique was originally created by https://twitter.com/advadnoun
- GOAI: Open GPU-Accelerated Data Analytics
- hamilton: A scalable general purpose micro-framework for defining dataflows. You can use it to build dataframes, numpy matrices, python objects, ML models, etc. Embed Hamilton anywhere python runs, e.g. spark, airflow, jupyter, fastapi, python scripts, etc
- Ibis: Scaling the Python Data Experience
- Kedro Tam-Sanh Nguyen - Writing and Scaling Collaborative Data Pipelines with Kedro - YouTube
- Lineapy
- Mandrova: Sensor Data Generator for Python3
- Mode - SQL, Python, & visualizations in one platform. Mode helps analysts and data scientists improve their workflow and share impactful analysis easily
- MKL Intel
- OpenRVDAS (Open Research Vessel Data Acquisition System) - a Python-based open source architecture intended to allow easy creation of customized data acquisition systems for research vessels and other scientific installations
- Prefect - The New Standard in Dataflow Automation - Prefect
- pylift: Uplift modeling and evaluation library. Actively maintained pypi version
- Pytubes - a library that optimizes loading datasets into memory
- RAPIDS Open GPU Data Science | RAPIDS
- RoboSat - an end-to-end pipeline written in Python 3 for feature extraction from aerial and satellite imagery
- siuba: Python library for using dplyr like syntax with pandas and SQL
- slr - Simple linear regression with confidence intervals on parameters and prediction
- Snorkel: A System for Fast Training Data Creation
- Introducing Snorkel
- Hand in hand with weak supervision using snorkel - Szymon Wojciechowski
- Weak Supervision: A New Programming Paradigm for Machine Learning
- Introducing the New Snorkel
- Snorkel is a fundamentally new interface to ML without hand-labeled training data
- ๊ฒ์์ ๋ถ์ ์ฌ์ฉ์๋ฅผ ํ์งํ๋ ๋ฐฉ๋ฒ, Snorkel์ ํ์ฉํด ๋ผ๋ฒจ ๋ณด์ ํ๊ธฐ
- Snorkel์ ์ด์ฉํ ์ง๋ฌด ํค์๋ ์ถ์ถ - DRAMA&COMPANY
- Tuplex is a parallel big data processing framework that runs data science pipelines written in Python at the speed of compiled code. Tuplex has similar Python APIs to Apache Spark or Dask, but rather than invoking the Python interpreter, Tuplex generates optimized LLVM bytecode for the given pipeline and input data set
- ๋ฐ์ดํฐ ํ์ง์ ๊ดํ 5๊ฐ ์ฒดํฌํฌ์ธํธ ์ ์ฒ๋ฆฌ์ ๊ด๊ณ๋ ๋งค์ฐ ์ค์ฉ์ ์ด๊ณ ์ค์ํ ๋ถ๋ถ์ ๋ํ ์ข์ ๊ธ
- Data Observability In Practice: Data Monitoring At Scale With SQL And Machine Learning - Monte Carlo Data
- Data Quality Automation at Twitter
- GX: a proactive, collaborative data quality platform โข Great Expectations
- ์ 1ํ ์ถ์ฒ ์์คํ ์ด๋.ppt
- ๋ฐ์ดํฐ๋ง์ด๋ 02-์ถ์ฒ์์คํ ๋ง๋ค๊ธฐ
- Recommending items to more than a billion people
- Recommendation Engines for Email Marketing
- Seldon
- The Netflix Prize and Production Machine Learning Systems: An Insider Look
- Netflix algorithm: Prize Tribute Recommendation Algorithm in Python
- ๋ทํ๋ฆญ์ค๋ ์ด๋ป๊ฒ ์๋ํ๋๊ฐ
- The Next Step in Personalization: Dynamic Sizzles | by Netflix Technology Blog | Nov, 2023 | Netflix TechBlog
- ๋ทํ๋ฆญ์ค์ ์๋ง์กด
- Deep Dive into Netflixโs Recommender System | by David Chong | Towards Data Science
- Building confidence in a decision | by Netflix Technology Blog | Netflix TechBlog
- Experimentation is a major focus of Data Science across Netflix | by Netflix Technology Blog | Jan, 2022 | Netflix TechBlog
- Speech-Based, Natural Language Conversational Recommender Systems
- Using Graph Theory to Build a Simple Recommendation Engine in JavaScript
- ์ค์๊ฐ ์ถ์ฒ์์ง ๋จธ์ ํ๋์ ๊ตฌ๊ฒจ๋ฃ๊ธฐ
- ์ถ์ฒ ์์คํ ์ ๊ธฐ์ด python RecSys
- MapReduce ๊ธฐ๋ฐ ๋์ฉ๋ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ
- ๋น ๋ฐ์ดํฐ์ NLP๋ฅผ ์ด์ฉํ 11๋ฒ๊ฐ ์ํ ์ถ์ฒ
- Building NLP Content-Based Recommender Systems A tutorial for a NLP recommendation engine using unsupervised learning
- Powerpoint-Slides for Recommender Systems - An Introduction
- Content Based Anime Recommender! ipynb notebook
- ๋ฅ๋ฌ๋ (Tensorflow) ์ ์ด์ฉํ ์ถ์ฒ์์คํ ๊ฐ๋ฐ
- Quick Guide to Build a Recommendation Engine in Python
- CatBoost - an open-source gradient boosting library with categorical features support
- categorical feature ์ง์. ranking, recommendation
- Industry's fastest inference implementation: Presenting to you the New version of CatBoost gradient boosting library
- CatBoost vs. Light GBM vs. XGBoost
- Recommendation System Algorithms
- ์ธ๊ณต์ง๋ฅ์ถ์ฒ์์คํ airs ๊ฐ๋ฐ๊ธฐ ๋ชจ๋ธ๋ง๊ณผ ์์คํ
- Spotifyโs Discover Weekly: How machine learning finds your new music ๋ ธ๋ ์ถ์ฒ
- Introduction to Recommender System. Part 1 (Collaborative Filtering, Singular Value Decomposition)
- Introduction to Recommendation Systems
- Listing Embeddings for Similar Listing Recommendations and Real-time Personalization in Search
- SK ICT Tech Summit 2017 ์ถ์ฒ ํ๋ซํผ ์ฝ๋ก์ธ์ค
- ๋์ผ๋ก ๋ฃ๋ ์์ ์ถ์ฒ ์์คํ CF, CBF
- ML: Matchbox Recommender ์ถ์ฒ ๋ชจ๋ธ ์ ์ฉ ์คํจ ์ฌ๋ก
- How Cambridge Analyticaโs Facebook targeting model really worked โ according to the person who built it
- The Remarkable world of Recommender Systems ๊ธฐ์ด๋ฅผ ์ดํดํ ์ ์๋ ๊ธ
- Recommendation Systems in the Real world
- ์ด์์ด, Interpretable Recommender System แแ ขแแ กแฏ แแ กแ แ จแแ งแซแแ ฎ, NDC 2019
- ๋ธ๋ฐ์น ์ถ์ฒ์ ํ์ ๋ํ 6๊ฐ์ง ๊ธฐ์ (่จ่ฟฐ)
- 2 years of Developing Personalized Real-Time Recommendation Service Based on Machine Learning
- System Design for Recommendations and Search
- ์ถ์ฒ๊ณผ ๊ฒ์์ ์์คํ
๋์์ธ์ ๋ ์ถ(Offline vs Online ํ๊ฒฝ / Candidate Retrieval vs Ranking)์ผ๋ก ๋๋์ด ๋ถ์
- 2 X 2์ Component๋ค์ ๋ฐฐ์นํด๋ณด๋ฉด ๋งํฌ์ ๊ทธ๋ฆผ ๊ฐ์ด ์๊ฐ ๊ฐ๋ฅ
- ์ ์๋ Alibaba, Facebook, JD, Doordash์์ ๊ณต์ ํ ์์คํ ๋์์ธ ์ฌ๋ก๋ค์ ์ด ํ๋ ์์ ๋ง์ถฐ ๋ถ์
- ํ๋ ์ ์ ์ ๋ฟ๋ง ์๋๋ผ ์ค๊ฐ์ค๊ฐ์ train-test skew ๋ฌธ์ , embedding model๊ณผ ANN์ ๊ฐ์ ์ปจํ ์ด๋์์ ์ด์ํ๋ ์ด์ , batch๋์ real-time recommendation์ด ์ ๋ง ํ์ํ๊ฐ ๊ฐ์ ์์ง๋์ด๋ง ์ด์๋ฅผ ๋ค๋ค์ ์ข์
- ๋ฒ์ญ๊ธ System Design for Recommendations and Search | You May Also Like
- ์ถ์ฒ๊ณผ ๊ฒ์์ ์์คํ
๋์์ธ์ ๋ ์ถ(Offline vs Online ํ๊ฒฝ / Candidate Retrieval vs Ranking)์ผ๋ก ๋๋์ด ๋ถ์
- Offline to Online: Feature Storage for Real-time Recommendation Systems with NVIDIA Merlin | NVIDIA Technical Blog
- ๋ญํน ์์คํ ํ๊ฐ ๋ฐฉ๋ฒ (MRR, DCG)
- How Youtube is recommending your next video
- Using machine learning to predict what file you need next
- Using machine learning to predict what file you need next, Part 2
- Powered by AI: Instagramโs Explore recommender system
- Youtube ์ถ์ฒ ์์คํ ๋ถ์
- Spotyfy๊ฐ ๋น์ ์ ์๊ณ ์๋ค, ์ด๋ป๊ฒ?
- LINE Timeline์ ์๋ก์ด ๋์ 1ํธ โ ์ถ์ฒ ์ปจํ ์ธ ํ์์ ์ํ Discover์ ์๋ก์ด ๊ตฌ๋ ๋ชจ๋ธ Follow
- LINE Timeline์ ์๋ก์ด ๋์ 2ํธ - Discover ๋๋ฆฌ๋ฒ๋ฆฌ ์์คํ ์๊ฐ - LINE ENGINEERING
- LINE Timeline์ ์๋ก์ด ๋์ 3ํธ - Discover ์ถ์ฒ ๋ชจ๋ธ - LINE ENGINEERING
- ์ถ์ฒ(Recommendation) ์์คํ - ์๊ณ ๋ฆฌ์ฆ Trend ์ ๋ฆฌ
- ์ถ์ฒ์์คํ ์ ๋น ์ ธ๋ค๊ธฐ
- ์ฟ ํก ์ถ์ฒ ์์คํ 2๋ ๊ฐ์ ๋ณ์ฒ์ฌ (์ํ์ถ์ฒ์์ ์ค์๊ฐ ๊ฐ์ธํ๋ก)
- ์ถ์ฒ ์์คํ (Recommendation System) - ํ์ ํํฐ๋ง (Collaborative filtering) ์ค๋ช (1)
- ์นด์นด์ค AI์ถ์ฒ : ํ์ ํํฐ๋ง ๋ชจ๋ธ ์ ํ ์์ ๊ธฐ์ค์ ๋ํ์ฌ โ tech.kakao.com
- ์ฝ๋์ ๋จธ์ ๋ฌ๋์ ํตํ ์ถ์ฒ ์์คํ ์ถ์ฒ ๋ฐฉ๋ฒ(๋ด์ฉ ๊ธฐ๋ฐ, ํ์ ํํฐ๋ง)
- ์ฐ๋ฆฌ ๋๋ค ๋ง์ง ์ถ์ฒ์์ง ์ง์ , ์ฝ๊ฒ ๋ง๋ค๊ธฐ (ํฌ๋กค๋ง๊ณผ ์ฝ์ฌ์ธ ์ ์ฌ๋) cosine similarity
- SaaS ์ถ์ฒ ์๋ฃจ์ ์ ์ด์ฉํ ๊ฐ์ธํ ์ถ์ฒ :: GS Retail Engineering
- ์ถ์ฒ์์คํ ๋ง์ง
- Learn About Recommender Systems With These 8 Resources
- ifkakao ์ถ์ฒ ์์คํ : ๋งฅ๋ฝ๊ณผ ์ทจํฅ ์ฌ์ด ์คํ๊ธฐ
- Simon Kim์ ๋ฐ์ดํฐ ๊ณผํ - YouTube
- ์ฟ ํก ์ถ์ฒ ์์คํ 2๋ ๊ฐ์ ๋ณ์ฒ์ฌ
- ์ถ์ฒ ์๋น์ค์ ์ํคํ ์ฒ 1 -์ถ์ฒ ์๋น์ค๋ ๋ฌด์์ธ๊ฐ. ์ด ๊ธ์์๋ ํ์ ๋ฌด์ฌ์ฝ ์ง๋์ณค์ ์ถ์ฒ ์๋น์ค๋ฅผ ์ข ๋ ์ดํดํ ์โฆ | by Jongmin Lee | How we build MyRealTrip | Nov, 2020 | Medium
- ์ถ์ฒ ์๋น์ค์ ์ํคํ ์ฒ 2 -์ถ์ฒ ์๋น์ค ์ ๊ณต์ ์ํ ์ํคํ ์ฒ | by Jongmin Lee | How we build MyRealTrip | Nov, 2020 | Medium
- ๋น์ ์ทจํฅ์ ๋ง์ง์ ์ถ์ฒํด๋๋ฆฝ๋๋ค : ์ฅ์ ๊ฐ์ธํ ์ถ์ฒ ์์คํ ์ ๋น๋ฐ
- ์ถ์ฒ์์คํ ํ๊ฐ๋ ์ด๋ป๊ฒ ํ๋ฉด ์ข์๊น?
- ๋ฒ์ญ๊ธ REVEAL'20 Workshop Introduction | You May Also Like
- T์์นด๋ฐ๋ฏธย |ย ์ค๋งํธย ICTย ์ ๋ฌธ๊ฐ ์์ฑ
- 1๋ ์ฐจ ์ฃผ๋์ด๊ฐ ์ถ์ฒ ์์คํ ํ์ฅ์์ ๋ง์ฃผํ ๊ณ ๋ฏผ. ๋จธ์ ๋ฌ๋์ ์ฌ๋ฌ ๋ถ์ผ ์ค ์ถ์ฒ ์์คํ ์ ๊ฐ์ฅ ํฐ ๋งค๋ ฅ์ ๋๊ผ์ต๋๋คโฆ | by Zimin | WATCHA | Apr, 2021 | Medium
- ๋น์ฉ ํจ์จ์ ์ธ Click-Through Rate Prediction ๋ชจ๋ธ๋ก ํ์ฟ ๋ ๋ผ์ด๋ธ ์ถ์ฒ์์คํ ๊ตฌ์ถํ๊ธฐ | Hyperconnect Tech Blog
- ์นด์นด์ค AI์ถ์ฒ : ํ ํฝ ๋ชจ๋ธ๋ง๊ณผ MAB๋ฅผ ์ด์ฉํ ์นด์นด์ค ๊ฐ์ธํ ์ถ์ฒ โ tech.kakao.com Multi Armed Bandit
- Advertiser Recommendation Systems at Pinterest | by Pinterest Engineering | Pinterest Engineering Blog | Jul, 2021 | Medium
- Recommender System KR
- Keynote 7: Moving Beyond Recommender Models - Even Oldridge (NVIDIA), Karl Byleen-Higley (NVIDIA) - YouTube
- Candidate Retrieval + Ranking๊ณผ ๊ฐ์ด 2-stage๋ก ์ด๋ค์ง ์ถ์ฒ ์์คํ
์ด ๋ง์ด ์ธ๊ธ
- ๋ฐํ์๋ ์ค์ ๋ก๋ Filtering๊ณผ Ordering์ด๋ผ๋ ์จ๊ฒจ์ง ๋จ๊ณ๊ฐ ์๊ธฐ ๋๋ฌธ์ 4 stage๊ฐ ํ์ํ๋ค๊ณ ์ฃผ์ฅ
- Filtering์ Candidate Retrieval ๋ค์์ ์ฌ์ฉ์ด ๋ถ๊ฐ๋ฅํ ์์ดํ ์ ์ถ๊ฐ๋ก ๊ฑธ๋ฌ๋ด๋ ๋จ๊ณ
- Ordering์ Ranking ๋ค์์ ์ต์ข ๋ฆฌ์คํธ ์์๋ฅผ ๊ฒฐ์ ํ ๋ ์์๋ฅผ ์กฐ์ ํ๊ฑฐ๋ ์์ดํ ์ ์ ์ธํ๋ ๋จ๊ณ
- Explicitํ๊ฒ ์ ์ฉ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง๊ณ ๋ชจ๋ธ์ด ํ์ตํ๊ธฐ ์ด๋ ต๊ฑฐ๋/ ๋ฒ๊ฑฐ๋ก์ด ๋น์ฆ๋์ค ๋ก์ง์ ์ ์ฉํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์์ ์ด์ ๋จ๊ณ์ ๊ตฌ๋ถ์ง์ด ์๊ฐํด์ผ ํ๋ค๊ณ ์ฃผ์ฅ
- ์ธ์คํ๊ทธ๋จ์ ์์๋ฅผ ์๊ฐํด๋ณด๋ฉด ๋ค๋ฅธ ์ ์ ๋ฅผ ์ฐจ๋จํ๊ฑฐ๋ ์๋ฆผ์ ๋๋ ๊ฒฝ์ฐ Filtering์์ ์ฐจ๋จํ ์ ์ ์ ๊ฒ์๊ธ์ ์ ์ธํ๋๊ฒ ํธํจ
- ๋ํ ํ ์ ์ ์ ๊ธ์ด ๋ญํน ์ ์๊ฐ ๋น์ทํด ํผ๋์ ์ฐ๋ฌ์ ๋์จ๋ค๋ฉด ์ ์ ๊ฒฝํ์ด ์ข์ง ์๊ธฐ ๋๋ฌธ์ ์์๋ฅผ ๋ค์ Ordering ํ ํ์ ์กด์ฌ
- Candidate Retrieval + Ranking๊ณผ ๊ฐ์ด 2-stage๋ก ์ด๋ค์ง ์ถ์ฒ ์์คํ
์ด ๋ง์ด ์ธ๊ธ
- ์ ํ๋ธ๋ ๋ด๊ฐ ์ข์ํ ๋ค์ ์์์ ์ด๋ป๊ฒ ์ถ์ฒํด์ค๊น? (์๊ธฐ ์ฝ๊ฒ ์ค๋ช ํ ๊ตฌ๊ธ ์ต์ ๋ ผ๋ฌธ) โ techNeedle ํ ํฌ๋๋ค
- Collaborative filtering doesn't work for us
- On YouTubeโs recommendation system
- Spotify๊ฐ ๋น์ ์ ์์ ๋ค์์ฑ์ ์ดํดํ๋ ๋ฐฉ๋ฒ โ ์ธ์ฌ์ดํธ์บ ํผ์ค
- ์นด์นด์ค AI์ถ์ฒ : ์นด์นด์ค์ ์ฝํ
์ธ ๊ธฐ๋ฐ ํํฐ๋ง (Content-based Filtering in Kakao) โ tech.kakao.com
- ์นด์นด์ค ์นํฐ์์ ์ฝํ ์ธ ๊ธฐ๋ฐ ํํฐ๋ง์ผ๋ก ๊ด๋ จ ์๋ ๋ค๋ฅธ ์ฝํ ์ธ ๋ฅผ ์ถ์ฒํ๋ ๋ฐฉ๋ฒ ์ค๋ช
- ์ฝํ ์ธ ์ ์ ์ฌ๋๋ฅผ ์ธก์ ํ๊ธฐ ์ํด์ ์์ดํ ์ ๋ฒกํฐ๋ฅผ ๋ง๋ค๊ธฐ ์ํด One-hot encoding๊ณผ Embedding
- ํํํ ๋ฐ์ดํฐ ๋ฒ์ฃผ์ ์์ญ์ด ๋๊ฑฐ๋ ๋ฐ์ดํฐ๊ฐ ๋ณต์กํ๋ค๋ฉด Embedding์ ๋ ๋ง์ด ์ฌ์ฉ
- ์ฝํ ์ธ ๊ธฐ๋ฐ ํํฐ๋ง์ ์๋น ์ด๋ ฅ์ด ์์ด๋ ์์ดํ ์ ๋ณด๋ง ์์ผ๋ฉด ์ถ์ฒํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ง๋ง, ์๋น ์ด๋ ฅ ๋ฐ์ดํฐ๊ฐ ์ถฉ๋ถํ๋ค๋ฉด ํ์ ํํฐ๋ง๋ณด๋ค ์ถ์ฒ ์ฑ๋ฅ์ด ๋ฐ๋ฆฐ๋ค๊ณ ํจ
- ์นด์นด์ค AI์ถ์ฒ : ์นด์นด์ค ์์ ์ถ์ฒ์ ๊ฒฝํํด๋ณด๊ณ ์ถ๋ค๋ฉด? Melon Playlist Dataset (feats. Kakao Arena) โ tech.kakao.com
- ๊ฐ๊ดํ ๋๊ธฐ ์ด๋ ค์ด ์ทจํฅ์ ๋ฒกํฐํ : ๋ค์ด๋ฒ ๋ธ๋ก๊ทธ
- Recsperts - Recommender Systems Experts
- ์ปจํ ์ธ ๊ธฐ๋ฐ ํํฐ๋ง ๊ตฌ์ถ๊ธฐ: MiniLM, ScaNN ๊ทธ๋ฆฌ๊ณ TFServing - The Highlights - ๋ผ์ด๋ ํ ๋ธ๋ก๊ทธ
- Insider Tips for Building Personalized Recommender Systems - YouTube
- Autoencoders | Machine Learning for Recommender Systems - YouTube
- ์ ์ ๋ฆฌ์์น ์์ง๋์ด์ ๊ฐ์ธํ ์ฝํ ์ธ ์ถ์ฒ ๋ชจ๋ธ ๊ตฌํ๊ธฐ. ์๋ ํ์ญ๋๊น, TVING Data Engineer ํ์ Researchโฆ | by ์ฃผ์ฐฌํ | tving.team | Mar, 2022 | Medium
- Bag-of-Tricks for Recommendation: Recency, Clustering ๊ทธ๋ฆฌ๊ณ Item Shuffling - The Highlights - ๋ผ์ด๋ ํ ๋ธ๋ก๊ทธ
- Learning to Rank - DRAMA&COMPANY
- Survey ์ถ์ฒ์์คํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋น๊ต
- Real World Recommendation System - Part 1 - by Nikhil Garg
- Real World Recommendation Systems - Part 2 (Training Data Generation)
- โAI ์ถ์ฒ ๊ธฐ์ โ์ ์ ๋ํ๋ ์นด์นด์ค ์ถ์ฒํ์ ์๊ฐํฉ๋๋ค. โ tech.kakao.com
- Reinforcement Learning for Budget Constrained Recommendations | by Netflix Technology Blog | Aug, 2022 | Netflix TechBlog
- ์ถ์ฒ ์์คํ : Bloom Filter for Filtering Layer
- Why do we need two-stage Recommender System?
- ํ๋์ ์ธ ์ถ์ฒ ์์คํ ๊ตฌ์ถ์ ์ํ ์ฌ์ - ํํ(LINER) I ๋ชจ๋์ฝ 2022 - YouTube
- Twitter's Recommendation Algorithm
- the-algorithm: Source code for Twitter's Recommendation Algorithm
- Twitter๊ฐ ์์ฌ์ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ์คํ์์ค ๊ณต๊ฐ
- ํธ์ํฐ์์ For You ํญ์ ๋ณด์ฌ์ค ํธ์์ ์ ์ ํ๋ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ํ๋ณด ์์ค๋ก ์์ต ๊ฐ์ ํ์์ 1,500๊ฐ์ ํธ์์ ์ถ์ถํด์ ๋ณด์ฌ์ฃผ๋๋ฐ ํธ์์ ์ฌ์ฉ์๊ฐ ํ๋ก์ํ๊ณ ์๋ In-Network ์์ค์ ํ๋ก์ํ๊ณ ์์ง ์์ Out-of-Network ์์ค ๋ ๊ฐ์ง๋ก ๋๋์ด์ 50:50 ๋น์จ๋ก ์ ์
- In-Network ์์ค์์๋ ๋ ์ฌ์ฉ์ ๊ฐ์ ์ํธ ์ฐธ์ฌ ๊ฐ๋ฅ์ฑ์ ์์ธกํ๋ ๋ชจ๋ธ์ธ Real Graph๋ฅผ ํตํด ํธ์์ ์์๋ฅผ ๊ฒฐ์
- Out-of-Network ์์ค์์๋ ํ๋ก์ฐํ์ง ์์์๋ ๊ด๋ จ์ฑ์ ์ฐพ์์ผ ํ๋ฏ๋ก ๋ ๊ฐ์ง ๋ฐฉ๋ฒ ์ฌ์ฉ
- ์์ ๊ทธ๋ํ๋ฅผ ํตํด ๋ด๊ฐ ํ๋ก์ํ๋ ์ฌ๋๋ค๊ณผ ๋น์ทํ ๊ด์ฌ์ฌ๋ฅผ ๊ฐ์ง ์ฌ๋๋ค์ ํตํด ์ค์๊ฐ ์ํธ์์ฉ ๊ทธ๋ํ๋ฅผ ์ ์งํ๋ ๊ทธ๋ํ ์ฒ๋ฆฌ ์์ง์ธ GraphJet์ ๊ฐ๋ฐ
- ์์ ๊ทธ๋ํ๋ณด๋ค ํจ์ฌ ํฐ ๋น์ค์ ์ฐจ์งํ๋ ์๋ฒ ๋ฉ ์คํ์ด์ค๋ ์ฌ์ฉ์์ ๊ด์ฌ์ฌ์ ํธ์์ ๊ด๋ จ๋๋ฅผ ์์น๋ก ๋ง๋ค์ด์ 145,000๊ฐ์ ์ปค๋ฎค๋ํฐ๋ฅผ 3์ฃผ๋ง๋ค ์ ๋ฐ์ดํธ
- ์ด๋ ๊ฒ ์์๊ฐ ์ ํด์ง ํธ์์ ์ต์ข ์ ์ผ๋ก ํํฐ๋ง ๋ฐ ์ ์ ๋ฅผ ๊ฑฐ์น ํ ์ฌ์ฉ์์๊ฒ ๋ณด์ฌ์ฃผ๋๋ฐ ์ด ํ์ดํ๋ผ์ธ์ด ํ๋ฃจ์ ์ฝ 50์ต ๋ฒ ์คํ๋๊ณ ํ๊ท 1.5์ด ์ด๋ด์ ์๋ฃ
- ์คํ ์์ค๋ฅผ ๊ณต๊ฐํ๋ฉด์ Elon Musk๋ฅผ ๋ฐ๋ก ์ฒ๋ฆฌํ๋ ์ฝ๋๊ฐ ๋ฐ๊ฒฌ๋์ด ๋ ผ์๊ฑฐ๋ฆฌ๊ฐ ๋์ ๋ฌธ์ ๋๋ ์ฝ๋์ Git ํ์คํ ๋ฆฌ๋ฅผ ์ ๋ฆฌํด์ ๋ค์ ์ ๋ก๋
- ์๋จ์ ํน) ํธ์ํฐ ์์ค์ฝ๋ ๊นํ์ ๊ณต๊ฐํจ - YouTube
- TikTok for Text! ๋ผ์ด๋ ์ฑ Session-based Recommender ๊ตฌ์ถ๊ธฐ โ The Highlights โ ๋ผ์ด๋ ํ ๋ธ๋ก๊ทธ
- The TikTok recommender system
- ์ถ์ฒ์์คํ Cold Start ๋ฌธ์ ๋ ์ด๋ป๊ฒ ํด๊ฒฐํ ๊น?
- ํ ์คใ ฃSLASH 23 - ๋จธ์ ๋ฌ๋์ผ๋ก ๋ ๋๋ํ๊ฒ ์ฆ๊ถ ๋ด์ค ์ ๊ณตํ๊ธฐ - YouTube
- Vinija's Notes โข Recommendation Systems โข Research Papers
- ๊ฑฐ๊ธฐ ๋ง๊ณ ์ด ํธํ ์ด๋? - ํธํ ์๋น์ค ์ถ์ฒ ์์คํ ๋์ ๊ธฐ
- Tech Radio : ํธํ ์ถ์ฒ ์๋น์ค(FOR YOU) ํธ
- ๊ฐ์ธํ ์ถ์ฒ ์์คํ #1. Multi-Stage Recommender System - ์ค๋์์ง ๋ธ๋ก๊ทธ
- ํด๋ฆญ๋ฅ ๊ทธ๋ฆฌ๊ณ ์ถ์ฒ ์์คํ
, ๊ธฐ์ ๊ณผ ๊ฐ์น์ ์กฐํ - ๋ชจ๋์์ฐ๊ตฌ์ differential privacy, federated learning
- ์ฐํฉ ํ์ต์ ์ด์ฉํ LINE ์คํฐ์ปค ์ถ์ฒ -ํ๊ตญ์ดํ- - YouTube
- VidiGo | ๋น๋๊ณ - Analyze Video AI
- ํ๋ ๋ ๋ฌ๋ ์๊ฐ ๋ฐ ๊ธฐ๋ณธ ๊ฐ๋
์ค๋ช
- ๋ผ์ธ์ ํค์ฟ ์น๊ฐ ํ๋ ๋ ๋ฌ๋ ๊ธฐ์ ๋์ ์ ๋ํด ์๊ฐ
- ํ๋ ๋ ๋ฌ๋์ด๋ ์๋ฒ์ ํด๋ผ์ด์ธํธ๊ฐ ํ๋ ฅํ์ฌ ํ์ตํ๋ ๊ธฐ์
- ์๋ฒ ์ค์ฌ, ์จ ๋๋ฐ์ด์ค, ํ๋๋ ์ดํฐ๋ ๋ฌ๋์ ์ธ ๊ฐ์ง ์ฃผ์ ํจํด ์ค๋ช
- ๋ผ์ธ ์คํฐ์ปค ์ถ์ฒ ์์คํ
๋์
- ๋ผ์ธ์์๋ ์ฌ์ฉ์ ์ ๋ ฅ์ ๋ฐ๋ผ ์ ์ ํ ์คํฐ์ปค๋ฅผ ์ถ์ฒํ๋ ๊ธฐ๋ฅ ๋์
- ์ฌ์ฉ์๊ฐ ์๋ฆฌ๊ฐ๋์ ๊ฐ์ ํค์๋๋ฅผ ์ ๋ ฅํ๋ฉด ๊ด๋ จ ์คํฐ์ปค ์ถ์ฒ
- ์ด ๊ธฐ๋ฅ์ ๋ค์ํ ์ธ์ด๋ก ํ๊ทธ๋ ์๋ง์ ์คํฐ์ปค ์ค์์ ์ ํ ๋์
- ๋จธ์ ๋ฌ๋์ ํ์ฉํ ์คํฐ์ปค ์ถ์ฒ ๊ณผ์ ์์ธ ์ค๋ช
- ์๋ฒ์ฌ์ด๋์์ ํ๋ณด ์คํฐ์ปค๋ฅผ ์ ์ ๋ณ๋ก ์ถ์ฒํ๊ณ ํด๋ผ์ด์ธํธ๋ ๋ฆฌ๋ญํน ์ฒ๋ฆฌ
- ์ ์ ์ ์์ดํ ์ ์ธ๋ฒ ๋ฉ ๋ฒกํฐ๋ฅผ ์์ฑํ์ฌ ์ ์ฌ๋์ ๋ฐ๋ฅธ ์ถ์ฒ ๋ฆฌ์คํธ ์์ฑ
- ์ด ๊ณผ์ ์ ์ฌ์ฉ์์ ๋ค์ํ ์ ๋ ฅ์ ๋์ํ์ฌ ์ฌ๋ฌ ์ถ์ฒ ๋ฆฌ์คํธ๋ฅผ ์์ฑ ๊ฐ๋ฅ
- ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๊ณผ ์ธํผ๋ฐ์ค ์ฒ๋ฆฌ
- ์๋ฒ์์ ์ฒ๋ฆฌ๋ ์ ์ ์ ์์ดํ ์ ์๋ฒ ๋ฉ์ด ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉ
- ์ด ๋ชจ๋ธ์ ํตํด ์ ์ ์๊ฒ ์ ํฉํ ์์ดํ ์ ์ค์ฝ์ด๋ก ํ๊ฐํ์ฌ ํ๋ณด ์คํฐ์ปค ์ ์
- ์ธํผ๋ฐ์ค๋ ์ ์ ์ ํ ์คํธ ์ ๋ ฅ์ ๋ฐ๋ผ ์คํฐ์ปค๋ฅผ ์ ์ํ๊ณ , ํ์ต์ ์ถ์ ๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์งํ
- ์์คํ
๊ตฌ์ฑ๊ณผ ํ๋ผ์ด๋ฒ์ ๋ณดํธ
- ์์คํ ์ ํฌ๊ฒ ์บ๋๋ฐ์ดํธ ์ ๋ค๋ ์ด์ ๊ณผ ๋ฆฌ๋ญํน ๋จ๊ณ๋ก ๋๋๋ฉฐ, ์๋ฒ์ ํด๋ผ์ด์ธํธ์์ ๊ฐ๊ฐ ์ฒ๋ฆฌ
- ํจ๋๋ ์ดํฐ๋ ๋ฌ๋์ ํตํด ๋๋ถ๋ถ์ ํ์ต ์ฒ๋ฆฌ๊ฐ ํด๋ผ์ด์ธํธ ์ชฝ์์ ์ด๋ฃจ์ด์ง๋ฉฐ, ๋ชจ๋ธ ํตํฉ์ ์๋ฒ์์ ์งํ
- ํ๋ผ์ด๋ฒ์ ๋ณดํธ ๊ธฐ์ ์ธ ์ฐจ๋ฑ ์ ๋ณด ๋ณดํธ๊ฐ ์ ์ฉ๋์ด ๊ฐ์ธ ์ ๋ณด ๋ณดํธ ๊ฐํ
- ์ฑ๋ฅ ํฅ์๊ณผ AB ํ
์คํธ ๊ฒฐ๊ณผ
- ๋จธ์ ๋ฌ๋ ๋์ ์ผ๋ก ์คํฐ์ปค ํจํค์ง ๋ค์ด๋ก๋ ์๊ฐ 5.6% ํฅ์๋์๋ค๋ ab ํ ์คํธ ๊ฒฐ๊ณผ ๋ฐํ
- ์ด๋ ์ฌ์ฉ์ ๊ฒฝํ ๊ฐ์ ์ ๊ธฐ์ฌํ๋ฉฐ, ํจ๋๋ ์ดํฐ๋ ๋ฌ๋์ ํตํ ๊ฐ์ธํ ์ถ์ฒ์ ์ฑ๊ณต ์ฌ๋ก
- ์ฐจ๋ฑ ์ ๋ณด ๋ณดํธ ๊ธฐ์ ์ ์ ์ฉํ์ฌ ์ฌ์ฉ์ ๊ฐ์ธ์ ๋ณด ๋ณดํธ๋ ๋์์ ๋ฌ์ฑ
- ์คํฐ์ปค ์ถ์ฒ ์์คํ
์ ๊ฐ์ ๊ณผ ํ๋ ฅ
- ์คํฐ์ปค ์ถ์ฒ์ ์ํด ๋ค์ด๋ก๋ํ ๋์ ๋ถ์
- ๋จธ์ ๋ฌ๋์ ํตํ ๊ฐ์ ๊ฐ๋ฅ์ฑ์ ํ์
- ๋์ฟ, ํ์ฟ ์ค์นด, ํ๊ตญ์ ๊ฑฐ์ ์ด ํ๋ ฅํ์ฌ ๋ค๊ตญ์ด ์ง์ ์์คํ ์ ๊ฐ๋ฐ
- ์๋น์ค ํ์ฅ๊ณผ ๊ฐ์ธ์ ๋ณด ๋ณดํธ ๊ธฐ์ ์ ์ฉ
- ์คํฐ์ปค ์ฌ์ฉ์๋ฅผ ๋์์ผ๋ก ์๋น์ค ํ์ฅ ๋ชฉํ๋ฅผ ์ค์
- ๊ฐ์ธ์ ๋ณด ๋ณดํธ ๊ธฐ์ ์ ์ ํํ ์ ์ฉ๊ณผ ์ด์์ ๋ชฉํ
- Ldp์ ์ ํ๋ง ๊ธฐ์ ๋์ ์ผ๋ก ๊ฐ์ธ์ ๋ณด ๋ณดํธ ๊ฐํ ์ถ๊ตฌ
- Federated Learning ๋์
๊ณ๊ธฐ์ ๋ฐ์ ์ ๋ง
- Federated learning ๋์ ๊ณ๊ธฐ์ ๊ทธ์ ๋ฐ๋ฅธ ๊ธฐ๋ ํจ๊ณผ๋ฅผ ์ค๋ช
- ํ๋ก์ ํธ ์ฐธ์ฌ ๋ฉค๋ฒ ๋ชจ์ง์ ์ด๋ ค์๊ณผ ํด๊ฒฐ ๋ฐฉ์์ ๊ณต์
- ๋น๋๊ธฐ์ ์์คํ ์ด์๊ณผ ๋ชจ๋ธ ๊ฐฑ์ ๋น๋์ ๋ํด ์ค๋ช
- ํ๋ ๋ ๋ฌ๋ ์๊ฐ ๋ฐ ๊ธฐ๋ณธ ๊ฐ๋
์ค๋ช
- note_04์10์ผ10์34๋ถ{{lilys_init}} | ์๋ฒฝํ ์์์์ฝ, ๋ฆด๋ฆฌ์ค์์ด์์ด | Lilys AI
- ์ฐํฉ ํ์ต์ ์ด์ฉํ LINE ์คํฐ์ปค ์ถ์ฒ -ํ๊ตญ์ดํ- | ์๋ฒฝํ ์์์์ฝ, ๋ฆด๋ฆฌ์ค์์ด์์ด | Lilys AI
- 1.๏ธ ๋ผ์ธ ์คํฐ์ปค ๊ธฐ์ ์ ํ์ฉํ ๋จธ์ ๋ฌ๋ ์๊ฐ
- ์๋ฒ์์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ํ์ต ํ ํด๋ผ์ด์ธํธ์ ์ ๋ฌํ์ฌ ํ์ต ๊ฒฐ๊ณผ ์ฒ๋ฆฌ
- ํจ๋ฉ๋ ๋ฌ๋์์ ํด๋ผ์ด์ธํธ ์ธก์์ ํ์ต ์ฒ๋ฆฌ๋ก ๋ชจ๋ธ ๋ฐฐํฌ ๋ฐ ๊ฒฐ๊ณผ ํตํฉ ์ฒ๋ฆฌ
- ์๋ฒ ์ธก ๋จธ์ ๋ฌ๋๊ณผ ์จ ๋๋ฐ์ด์ค ๋จธ์ ๋ฌ๋์ ์ฅ๋จ์ ๋ฐ ํ์ฉ ๋ฐฉ์ ์๊ฐ
-
- ํด๋ผ์ด์ธํธ ๋ฌ๋๊ณผ ์คํฐ์ปค ์ถ์ฒ์ ๋์ ์๋ฆฌ ์ค๋ช
- ํด๋ผ์ด์ธํธ ๋ฌ๋์ ํด๋ผ์ด์ธํธ ์์ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ณ ํ์ต์ ํ์ฉํ์ฌ ์๋ฒ๋ก ๋ณด๋ด๋ ๋คํธ์ํฌ๋ฅผ ์ค์ฌ ํ๋ผ์ด๋ฒ์ ๋ณดํธ
- ์คํฐ์ปค ์๋ ์ถ์ฒ์ ํตํด '์๋ฆฌ๊ฐ๋'๋ '์๋ ํ์ธ์'์ ๊ฐ์ ํ๊ทธ๋ก ์คํฐ์ปค๋ฅผ ์ ํํ ์ ์์ผ๋ฉฐ, ์๋ฏธ์ ๋ผ๋ฒจ์ ํ์ฉํ์ฌ ์ถ์ฒ
- ์ ๋ ฅํ ๊ธ์๋ ์๋ฏธ์ ๋ผ๋ฒจ๋ง์ ํตํด ์คํฐ์ปค ์ถ์ฒ์ ํ์ฉ, 'ใฑใท'๋ก ์์ํ๋ฉด '์๋ฆฌ๊ฐ๋', 'ใด' ์ถ๊ฐํ๋ฉด '์๋ ํ์ธ์' ์คํฐ์ปค ์ถ์ฒ
-
- ๋ผ์ธ์ ํฌ๋ฆฌ์์ดํฐ์ฆ ๋ง์ผ: ํ๊ทธ ๊ธฐ๋ฅ๊ณผ ์ธ์ด ๋ค์์ฑ
- ๋ผ์ธ์ ํฌ๋ฆฌ์์ดํฐ์ฆ ๋ง์ผ์ ํตํด ์คํฐ์ปค์ ํ๊ทธ ์ฐ๋ ํ์ธ ๊ฐ๋ฅ
- ๋ค๊ตญ์ด ํ๊ทธ๋ฅผ ์๋ ๋๋ ์ด๋ฏธ์ง ๋ถ์์ ํตํด ์ ์ํ๋ฉฐ, ์ผ๋ณธ์ด ํ๊ทธ๊ฐ ๊ฐ์ฅ ๋ค์ํจ
- ์์คํฐ์ปค ํ๋ฆฌ๋ฏธ์ ์๋น์ค๋ 10๋ฐฑ๋ง ์ด์ ์คํฐ์ปค ํจํค์ง ์ค ์ฌ์ฉ์ ์ ํ ๊ฐ๋ฅ, ๋ค์ด๋ก๋ ๋ถํ์
- ์คํฐ์ปค ํ๋ฆฌ๋ฏธ์์ ์๋ ๋ค์ด๋ก๋๋ฅผ ํฌํจํ ๋ ๊ฐ์ง ์ข ๋ฅ์ ์คํฐ์ปค๋ฅผ ์ ๊ณตํ๋ฉฐ, ํผ๋ณดํธ ๋ค์ด๋ก๋ ์์คํ ํ์ฑํ
-
- ์ ์ ๋ณ ์คํฐ์ปค ์ถ์ฒ ๋ฐ ๋ญํน ์ฒ๋ฆฌ
- ์๋ฒ์ฌ์ด๋์์ ์บ๋๋ฐ์ดํธ ์ ๋ค๋ ์ด์ ์ ํตํด ์ ์ ๋ณ ์คํฐ์ปค ์ถ์ฒ์ ์ฒ๋ฆฌ
- ํด๋ผ์ด์ธํธ ์ธก์์๋ ์ ์ ๋น ํ๋ณด ์์ฑ ๋ฐ ๋ญํน์ ๋ด๋นํ๋ฉฐ, ์ ์ ์๋ฒ ๋ฉ๊ณผ ์์ดํ ์๋ฒ ๋ฉ์ ํ์ฉํ์ฌ ์ถ์ฒ ํด๋ฌ์คํฐ๋ง์ ์ค์
- ์ด๋ฅผ ํตํด ์ ์ ์ ์ทจํฅ์ ๊ณ ๋ คํ ์ค์ฝ์ด๋ฅผ ์ป๊ณ , ์ ํฉํ ์คํฐ์ปค๋ฅผ ์ธํผ๋ฐ์ค ์ฒ๋ฆฌํ์ฌ ํ์
- ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ๋ค์ด๋ก๋ํ์ฌ ์ฒ๋ฆฌํ๋ฉฐ, ๋๋ฐ์ด์ค ์ฌ์ฉ์๊ฐ ์ดํ๋ฆฌ์ผ์ด์ ์ ์ฌ์ฉํ์ง ์์ ๋๋ ์๋
-
- ๋จธ์ ๋ฌ๋์ด ์บ๋ ๋ฐ์ดํธ ์คํฐ์ปค ์ ํ ๋ฐ ์ฑ๋ฅ ํฅ์์ ๋ํ ๋น๊ต
- ํผ์คํธ ์คํ ์ด์ง์์๋ ์บ๋ ๋ฐ์ดํธ ์คํฐ์ปค๋ฅผ ์ ํํจ์ ์์ด ๋จธ์ ๋ฌ๋ ํ์ฉ, ์ธํฌ๋ ์ค ํธ๋ ์ด๋์ ์๋ฒ ์ธก์์ ๋ชจ๋ ์ฒ๋ฆฌ ๋ด๋น
- ์ธ์ปจ๋ ์คํ ์ด์ง ๋ฆฌ๋ญํน์์๋ ์คํฌํ, ์ธํ๋ ์ด์ ์ฌ๋ถ, ํด๋ฆญ ์ ๋ณด ํ์ฉํ์ฌ ํผ์ค๋๋ผ์ด์ ์ด์ ์ค์, ์ถ๋ก ์ฒ๋ฆฌ ํด๋ผ์ด์ธํธ ์ธก์์
- ๋ง์ง๋ง์ผ๋ก ํ๋๋ ์ดํฐ๋ ๋ฌ๋ ๊ธฐ๋ฒ์ ์ฌ์ฉํ์ฌ ํด๋ผ์ด์ธํธ ์ชฝ์์ ๋๋ถ๋ถ์ ํ์ต ์ฒ๋ฆฌ๋ฅผ ํ๊ณ , ๋ชจ๋ธ ํตํฉ์ ์๋ฒ์์ ์งํ
- ํ๋ซํผ์ผ๋ก์ ๊ฐ๋ฐ๋ ์คํฐ์ปค ํ๋ฆฌ๋ฏธ์ด๋ฌ๋ ์ ํ๋ฆฌ์ผ์ด์
๋ฐ ์๋น์ค์์ ํ์ฉํ๋๋ก ์กฐ์น
- ํ๋ซํผ ๊ฐ๋ฐ ์ ์ค์ํ ์๊ฑด์ ์ ํ๋ฆฌ์ผ์ด์ ํ์ต ๋ฐ ๊ฐ์ธ์ ๋ณด ๋ณดํธ ๊ธฐ๋ฅ์ ๊ณตํตํ
-
- ์์คํ ๊ตฌ์ฑ ์ค๋ช ๋ฐ ๊ตฌ๋ถ, ๊ตฌ์ฒด์ ์ธ ์ฒ๋ฆฌ ๊ณผ์
- ์์คํ ๊ตฌ์ฑ ์ค๋ช ์ ํตํด ์์ ๋น์ฆ๋์ค ๊ตฌํ ๋ฐ ๋จธ์ ๋ฌ๋ ์ฒ๋ฆฌ๋ฅผ ์๋ฒ์ ํด๋ผ์ด์ธํธ๋ก ๋๋์ด ์ค๋ช
- ํด๋ผ์ด์ธํธ ์ธก์์ ๋ฆฌ๋ญํน ์ฒ๋ฆฌ๋ฅผ ์ ํ๋ฆฌ์ผ์ด์
๊ณผ ํ๋ซํผ์ ํตํด ๋ถ๋ด ์ค๋ช
- ์ฌ์ฉ์ ์ ๋ ฅ์ ๋ฐ๋ฅธ ์์ธก ์์ฒญ๊ณผ ์ฒ๋ฆฌ๊ณผ์ , ํด๋ฆญ ์ ๋ณด์ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ ์ค๋ช
- ๋ฐ์ดํฐ ์ ์ก, ์ ๋ฆฌ ๋ฐ ํ์ต ์๊ธฐ ๋ฑ์ ์ฒ๋ฆฌ๊ณผ์ ์ ๋ํด ์ดํ๋ฆฌ์ผ์ด์ ์ธก๊ณผ ํ๋ซํผ ์ธก ์ญํ ์ ๋๋์ด ์ค๋ช
-
- ๋ก๊ทธ ํ์ต ๋ฐ ํ๋ซํผ ์ง์ ๊ธฐ๋ฅ ์๊ฐ
- ๋ก๊ทธ๊ฐ ํด๋ผ์ด์ธํธ ์ ํ๋ฆฌ์ผ์ด์ ์ธก์์ ํ๋ซํผ ์ธก์ผ๋ก ์ ์ก๋๊ณ , ํ์ต ๋ฐ ๋ชจ๋ธ ๊ฐฑ์
- ํ๋ซํผ์ด ์ง์ํ๋ ๊ธฐ๋ฅ์ผ๋ก ABTS ๋์ , user embedding๊ณผ ๋ชจ๋ธ ์ ํ์ฑ ์ ์ง๋ฅผ ์ํ ๊ธฐ๋ฅ์ด ํ์ํ๋ค๊ณ ์๊ฐ
- ๋ํ, ํด๋ผ์ด์ธํธ ํ์ต, ๋ชจ๋ธ ํ์ต ์ค์ผ์ค๋ง, ๊ทธ๋ฆฌ๊ณ iOS์ ์๋๋ก์ด๋ ํ๊ฒฝ ๋ชจ๋๋ฅผ ์ง์ํ๊ธฐ ์ํด ์ค๋ฅ์ค๋ฐํ์์ ์ฌ์ฉํ๋ค๊ณ ์ค๋ช
- ๋ด์ผ ์์ ๋ ์ถ๊ฐ ๋ฐํ๋ฅผ ํตํด ๋ ์์ธํ ๋ด์ฉ์ด ์๊ฐ๋ ์์ ์ด๋ฉฐ, ํ๊ตญ ์ค์ฌ๋๊ป์ ๋ฐํ๋ฅผ ์งํํ ์์
-
- ํ๋ซํผ ๊ฐ๋ฐ์์ ํ๋ผ์ด๋ฒ์ ๋ณดํธ์ ๋ํ ์ ๊ทผ๋ฐฉ์
- ํ๋ซํผ์ ์๋ฒ ์ธก ๋ฐ์ดํฐ๋ฅผ ์ต์ํํ๊ณ ์ฐจ๋ฑ ์ ๋ณด๋ณดํธ ๊ธฐ์ ์ ์ ์ฉํ๋ ๋ ๊ฐ์ง ๋ฐฉ๋ฒ ์ฌ์ฉ
- ๋ก์ปฌ์์ ๋ฐ์ํ ๋ก๊ทธ๋ฅผ ํ์ตํ ํ ๋ ธ์ด์ฆ ์ถ๊ฐ๋ก ๊ฐ์ธ์ ๋ณด ๋ณดํธ๋ฅผ ๊ฐํ
- ํ๋๋ ์ดํฐ๋ ๋ฌ๋์์, ๊ฐ์ฐ์์ ๋ฉ์ปค๋์ฆ๊ณผ ๊ฐ์ค์น ๋ถ์ฌ ๊ธฐ์ ์ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์ ์๋ณ ์ ๋ณด๋ฅผ ์ญ์ ํ์ฌ ๋ชจ๋ธ์ ์๋ฒ๋ก ์ ๋ก๋
- ๊ฒฐํฉ๋ ๋ชจ๋ธ์ ์ ํํ ํ์ต์ ๋ณด์ฅํ๋ฉฐ, ์์ ๋ ธ์ด์ฆ ์ ์ฉ์ผ๋ก ๊ฐ์ธ์ ๋ณด ๋ณดํธ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐํ
-
- AB ํ ์คํธ ๊ฒฐ๊ณผ์ ๊ฐ๋ฐ ์๊ฐ
- AB ํ ์คํธ ๊ฒฐ๊ณผ๋ก ์คํฐ์ปค ๋ค์ด๋ก๋๋ 5.6% ํฅ์, ์ฌ์ฉ์ ์ ๋ฆฌํํธ ํด์
- ๋ค๊ตญ์ด ์ง์ ์์คํ ๊ฐ๋ฐ์ ์ ์ธ๊ณ์ ์์ง๋์ด 30๋ช ์ด์ ํ์กฐ
- ํฅํ ๋ชฉํ๋ ์คํฐ์ปค ์ฌ์ฉ์ ํ๋, ๊ฐ์ธ์ ๋ณด ๋ณดํธ ๊ฐํ๋ฅผ ํตํ ์๋น์ค ํฅ์
- ldp ํ๋ผ๋ฏธํฐ์ ์ ํ๋ง ๊ธฐ์ ๋์ ์ผ๋ก ๊ฐ์ธ์ ๋ณด๋ฅผ ๋์ฑ ํจ๊ณผ์ ์ผ๋ก ๋ณดํธํ ๊ณํ
-
- ๊ธฐ์ ๊ฐ๋ฐ ํ๋ก์ ํธ์์ ํ๋ ฅ๊ณผ ์ด๋ ค์
- ๊ธฐ์ ์ ์ธ ํ๋ฟ๋ง ์๋๋ผ ์์ ์ฃผ๊ธฐ๋ ๊ณ ๋ คํ์ฌ ์คํฐ์ปค ๊ธฐ๋ฅ์ ๊ฐ๋ฐ
- ํ๋ซํผ ๊ฐ๋ฐ ์ ์์ง๋์ด๋ค๊ณผ ๋งค๋์ ์ ํ๋ ฅ์ด ์ค์ํ๋ฉฐ ๊ธฐ์ ์ ์ถ์ ๋งค๋์ ๊ฐ ๊ฐ๋ฐ ๋ฆฌ์์ค ํ ๋น
- ํ๋๋ ์ดํธ ๋ฌ๋ ๊ธฐ๋ฅ ๋ฑ ๋ค์ํ ๊ธฐ์ ๋ค์ ์กฐํฉํ๋ฉฐ ์ด๋ ค์์ ํ๋ผ์ด๋ฒ์์ ์ปค๋ฎค๋์ผ์ด์ ๋ถ๋ถ, ํ์กฐ๋ฅผ ํตํด ์ฑ๊ณต์ ์ผ๋ก ํด๊ฒฐ
- 12.๋๋ฐ์ด์ค ๊ฐ ๋ฐ์ดํฐ ์ฐ๋๊ณผ ์ ์ ๊ฐ์ธ์ ๋ณด ๋ณดํธ ๋ฐฉ์์ ๋ํ ๋
ผ์
- ๋๋ฐ์ด์ค ๋ณ๊ฒฝ ์ ๋ก๊ทธ ๋ฐ์ดํฐ ๊ณ์น ๊ฐ๋ฅ, ํด๋ผ์ด์ธํธ ์ธก์์ ์ ์ ์ ์ธ๋ฒ ๋ฉ ์์ดํ ๊ณผ ๋ชจ๋ธ์ ์ ์ง
- ๋ฐ์ดํฐ ์ฒ๋ฆฌํ์ฌ ๊ฐ์ธํ๋ฅผ ์ ๊ณตํ๊ณ ์๋๋ฐ, ์ธ์ปจ๋ ๋๋ฐ์ด์ค ๋ฌธ์ ์กด์ฌ
- ์๋ฒ์ ํด๋ผ์ด์ธํธ ๊ฐ ๋น๋๊ธฐ ํ์ต ๊ตฌ์กฐ๋ก, ๋ชจ๋ธ ๊ฐฑ์ ๋น๋ ์์น ์ค
- ์ ์ ๊ฐ์ธ์ ๋ณด ๋ณดํธ๋ฅผ ์ํด ์ธ์ ๋๊ธฐํ ํ์ํ๋ฉฐ, ๋ฆด๋ฆฌ์ค ํ ABํ ์คํธ์ ํ์ต ๊ฐฑ์ ์ด ์ด๋ฃจ์ด์ง
- 1.๏ธ ๋ผ์ธ ์คํฐ์ปค ๊ธฐ์ ์ ํ์ฉํ ๋จธ์ ๋ฌ๋ ์๊ฐ
- VidiGo | ๋น๋๊ณ - Analyze Video AI
- ์ฐํฉ ํ์ต์ ์ด์ฉํ LINE ์คํฐ์ปค ์ถ์ฒ -ํ๊ตญ์ดํ- - YouTube
- ์์๋ฅด์์ AI ๊ธฐ๋ฐ ์ถ์ฒ ๋ชจ๋ธ์ ํ๊ฒ ์งํ๋ฅผ ์ค์ ํ๋ ๋ฐฉ๋ฒ (feat. ์ํ ๋ชจ๋ฉํธ) | Hyperconnect Tech Blog
- ์ถ์ฒ ์์คํ ๊ฐ์ ์ ์ํ Feature Store ๋์ ๊ธฐ - RIDI Corp.
- ํจ๊ป ๊ตฌ๋งคํ๋ฉด ์ข์ ์ํ์ด์์! - ์ฅ๋ฐ๊ตฌ๋ ์ถ์ฒ ๊ฐ๋ฐ๊ธฐ 1๋ถ - ์ปฌ๋ฆฌ ๊ธฐ์ ๋ธ๋ก๊ทธ
- ํจ๊ป ๊ตฌ๋งคํ๋ฉด ์ข์ ์ํ์ด์์! - ์ฅ๋ฐ๊ตฌ๋ ์ถ์ฒ ๊ฐ๋ฐ๊ธฐ 2๋ถ - ์ปฌ๋ฆฌ ๊ธฐ์ ๋ธ๋ก๊ทธ
- ์ค์๊ฐ ๋ฐ์ํ ์ถ์ฒ ๊ฐ๋ฐ ์ผ์ง #1. ํ๋ก์ ํธ ์๊ฐ | ์ฐ์ํํ์ ๋ค ๊ธฐ์ ๋ธ๋ก๊ทธ
- Awesome-Generative-RecSys: A curated list of Generative Recommender Systems (Paper & Code)
- ํ์ด์ฌ ์ถ์ฒ ์์คํ ์ฌํ๊ณผ์
- ์ถ์ฒ์์คํ ๋ง๋ค๊ธฐ Hands-on part01 django ์ด์ฉ
- Collaborative-filtering-Tutorial
- Machine Learning for Retail Price Recommendation with Python
- Building and Testing Recommender Systems With Surprise, Step-By-Step - Learn how to build your own recommendation engine with the help of Python and Surprise Library, Collaborative Filtering
- PyCon KR 2019 ์ถ์ฒ์์คํ ์ด์ ๋ ๋์ด ๋์ด์ผ ํ๋ค
- Analyzing Hacker News book suggestions in Python
- Keeping Sensitive Data Safe Using Recommendation Systems | PyData Global 2021 - YouTube
- Machine Learning Recommender System With Python - YouTube
- ์ํ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ Item-CF์ ์ต์ ํ ์ฌ์
- ์คํ์ฑ ํด์ํ๊ทธ ์์ธก์ ์ํ ๋ค์ค ๋ ์ด๋ธ ๋ถ๋ฅ ๋ชจ๋ธ ๊ฐ๋ฐํ๊ธฐ
- implicit: Fast Python Collaborative Filtering for Implicit Feedback Datasets
- recommender_system_with_Python: recommender system tutorial with Python
- Recommender Utilities โ Microsoft Recommenders 1.1.0 documentation
- Surprise - A Python scikit for recommender systems
- TOROS: Python Framework for Recommender System
- TOROS Buffalo: A fast and scalable production-ready open source project for recommender systems