크롤링은 프로그래밍으로 사람마다 차이가 많이 난다.
파이썬은 크롤링 예자가 가장 많고, 가장 쉬움.
파이썬과 크롤링은 데이터 과학에서 어디에 속할까???
파이썬은 컴퓨터과학에서 웹 분야, 응용 프로그램 분야, iot, 빅데이터 를 다룰 수 있다.
데이터 과학 분야 단계: 데이터 수집(크롤링) > 데이터 저장(추출) > 데이터 분석(통계학) > 데이터 시각화 > 서비스 개발
→ 데이터가 가장 많은 곳은 '웹'이다.
파이썬을 사용하려면??
# 컴파일러 프로그램 설치가 필요로 하다. => 아나콘다 (확장기능 + 컴파일러 프로그램 + 코드 작성이 편리한 툴 을 한 번에 설치할 수 있는 프로그램)
문제1. print함수를 사용하여 3.141592 값을 출력하라. 단 소수점 첫 째자리만 출력하라.
#boolean 타입: True, False (접두사가 대문자)
문제2. 반지름(r=10)을 선언하고, 이를 이용하여 원의지름, 둘레, 넓이를 각각 출력해보세요.
🐶 입력
🐶 문자열
파이썬은 문자열을 다루는 기능이 쉽고 간단하다.
"한 줄만 가능하다!!" => 한줄만 가능하다.
1. 변수이름.count(문자열): 해당 문자열에서 'to'가 몇 개 나왔는지 알아보자.
2. len(변수 및 문자열): 문자가 몇 개인가?
3. 변수.find('찾고싶은문자'): 특정 문자의 인덱스를 뽑아낸다.
4. 변수.replace('기존문자', '변경할 문자'): 특정 문자열을 다른 문자열로 바꾼다.
5. 변수또는문자열.[시작인덱스: 마지막인덱스]: 슬라이싱
※ 글자 개수는 마지막 인덱스 - 시작 인덱스 개수만큼 나온다!
시작인덱스는 무조건 나오지만 마지막인덱스는 나오지 않고, 마지막 인덱스의 바로 앞 문자까지만 출력됨!
6. 문자열또는변수.strip(): 문자열을 복사해서 가져오다 보면 이렇게 앞 뒤로 스페이스가 띄어져있는 경우가 많다. 이거를 없애고 싶다면? ↓
7. 변수또는문자열.format() : 변수 또는 문자열의 중괄호 부분에 내가 넣고자 하는 단어를 넣을 수 있다.
format은 숫자의 형태도 변형할 수 있다!
🐶 문제
문제1. print 함수를 사용하여 3.141532값을 출력하라. (단, 소수점 아래 첫 번째 자리만 표시되도록 하세요.)
문제2. 문자열 '720'을 정수형으로 변환하라. 정수 100을 문자열 '100'으로 변환하라.
문제3. 밑이 6이고, 지수가 2일 때 거듭 제곱을 출력하라.
문제4. 사용자로 부터 두 개의 숫자를 받은 후 두 개의 숫자를 더한 값, 곱한 값, 나눈 값을 각각 출력하는 프로그램을 작성하여라.
문제5. 사용자로부터 두 개의 숫자를 입력받은 후 두 개의 숫자를 더한 값, 곱한 값, 나눈 몫, 나머지값을 각각 출력하는 프로그램을 작성하여라.
문제6. 사용자로부터 두 개의 숫자를 입력받은 후 두 개의 숫자를 더한 값, 곱한 값, 나눈 값, 나눈 몫, 나머지 값을 각각 다음과 같이 출력하는 프로그램을 작성하세요.
* 단, 나눈 값은 소숫점 첫 번째 자리만 출력하세요.
🐶 정리
1. count(문자열): 해당 문자열이 몇 번 나왔어??? 2. len(문자열): 해당 문자열이 몇 글자야? 3. .find('단어'): 앞 문자열 또는 변수에서 찾고 싶은 단어 4. .replace('기존','대체'): 대체할 문자 5. [시작인덱스:마지막인덱스]: 마지막인덱스 - 시작인덱스 만큼 글자를 뽑아냄. 6. .strip('제거하고자하는 문자'): 공백이면 스페이스바 제거 7. .format(): 중괄호를 대체할 문자 7-1. format(부동소수점, ".2f"): 소수점 둘 쨰자리까지만 출력을 한다. |
'Python' 카테고리의 다른 글
[입문]감잡기-데이터 구조 (0) | 2023.09.15 |
---|---|
[입문]감잡기-반복문 (0) | 2023.09.11 |
[입문]감잡기-조건문 (0) | 2023.09.08 |
[입문] 감잡기 - 리스트 (0) | 2023.09.08 |