Rooam Lee's Blog
Rooam Lee's Blog

Python Developer with a focus on Backend, Data, and DevOps

Home Categories Tags About Docs
  • Crawling

    Crawling Advanced Scraping

    웹 크롤링은 웹사이트에서 데이터를 추출하는 작업입니다. 대규모 크롤링을 다룰 때 Scrapy는 매우 유용한 도구입니다. Scrapy는 효율적이고 확장 가능한 웹 크롤링 및 스크래핑 프레임워크로, 대규모 데이터를 쉽게 처리할 수 있습니다. Large-Scale Scraping Scrapy는 대규모 웹 크롤링... 2025년 01월 19일
  • Crawling

    Crawling Dynamic Websites

    Selenium은 동적 웹사이트에서 데이터를 크롤링하는 데 매우 유용한 도구입니다. 최근에는 webdriver-manager 패키지를 사용하여 브라우저 드라이버를 자동으로 설치하고 관리하는 방식이 선호되고 있습니다. Selenium Manager 아래 명령어를 통해 selenium과 webdriver-manager를 설치합니다. 이를 사용하면 번거롭게 드라이버를 직접 다운로드하거나... 2025년 01월 15일
  • Crawling

    Crawling Data Extraction

    BeautifulSoup는 Python에서 HTML 및 XML 문서를 파싱하고, 그 문서에서 필요한 데이터를 쉽게 추출할 수 있도록 도와주는 라이브러리입니다. 웹 크롤링을 할 때, BeautifulSoup는 웹 페이지의 HTML을 구조적으로 이해하고, 원하는 데이터를 쉽게 찾고 추출하는 데 매우 유용합니다.... 2025년 01월 15일
  • Python

    Python Debugging Essentials

    Python에서 테스트와 디버깅은 코드의 품질을 보장하고, 버그를 최소화하며, 프로그램의 안정성을 높이는 데 중요한 역할을 합니다. Python은 로깅, 디버깅 툴, 단위 테스트 등의 다양한 방법을 제공합니다. Logging 로깅(Logging)은 프로그램 실행 중에 발생하는 이벤트를 기록하는 기법입니다. 로깅을... 2025년 01월 12일
  • Crawling

    Crawling HTTP Requests

    HTTP(HyperText Transfer Protocol)는 웹에서 클라이언트와 서버 간에 데이터를 주고받는 프로토콜입니다. 웹 페이지를 요청하거나 데이터를 전송할 때, HTTP 요청을 통해 정보를 주고받습니다. Protocol HTTP 요청 방식에는 여러 가지가 있으며, 각각 특정한 목적에 맞게 사용됩니다. 가장 일반적으로... 2025년 01월 12일
  • Python

    Python Project Management

    Python 프로젝트를 관리하는 데는 가상환경 설정, 의존성 관리, 코드 스타일 가이드 등의 중요한 측면이 있습니다. 이들 각각의 기법을 활용하면 프로젝트를 효율적으로 관리하고, 다른 개발자와 협업하며, 일관된 코드를 유지할 수 있습니다. Virtual Environment 가상환경(Virtual Environment)은 프로젝트마다... 2025년 01월 08일
  • Python

    Python Networking

    Python은 네트워크 애플리케이션을 작성하는 데 필요한 다양한 도구와 라이브러리를 제공합니다. 네트워크 프로그래밍은 소켓 프로그래밍, HTTP 요청, 그리고 API 통신 등을 포함합니다. Socket Programming 소켓 프로그래밍(Socket Programming)은 네트워크를 통해 데이터 통신을 수행하는 기본적인 방법입니다. Python에서는 socket... 2025년 01월 08일
  • Python

    Python File Management

    파일 입출력은 데이터를 파일에 저장하거나 파일에서 데이터를 읽는 작업을 처리하는 과정입니다. Python은 파일 작업을 위한 다양한 기능을 제공하며, 이를 통해 텍스트 파일, JSON 파일, CSV 파일, 바이너리 파일 등을 쉽게 처리할 수 있습니다. File 파일을... 2025년 01월 08일
  • Python

    Python Data Science

    Python은 데이터 분석, 처리, 시각화 및 수집에 매우 유용한 라이브러리들을 제공합니다. Data Analysis Numpy Numpy는 수치 계산을 위한 라이브러리로, 고성능 다차원 배열 객체와 다양한 수학 함수를 제공합니다. import numpy as np # Numpy 배열 생성... 2025년 01월 08일
  • Python

    Python Parallel Processing

    Python에서 병렬 처리(parallel processing)는 다중 작업을 동시에 수행하여 효율성을 높이는 방법입니다. 병렬 처리 기법으로는 멀티스레딩, 멀티프로세싱, 비동기 프로그래밍 등이 있습니다. 각 기법은 상황에 따라 다르게 사용될 수 있으며, 이를 적절히 활용하면 성능을 크게 향상시킬 수... 2025년 01월 05일

Copyright (c) 2024 Rooam Lee. All rights reserved.

  • GitHub
  • LinkedIn
  • Twitter
  • YouTube
  • Stack Overflow
  • Gmail
  • RSS