Python

[입문] 감잡기 - 문자열

Bordercolli 2023. 9. 8. 09:54
728x90

크롤링프로그래밍으로 사람마다 차이가 많이 난다. 

파이썬은 크롤링 예자가 가장 많고, 가장 쉬움. 

 

파이썬과 크롤링은 데이터 과학에서 어디에 속할까???

데이터과학

파이썬은 컴퓨터과학에서 웹 분야, 응용 프로그램 분야, iot, 빅데이터 를 다룰 수 있다.

 

데이터 과학 분야 단계: 데이터 수집(크롤링) > 데이터 저장(추출) > 데이터 분석(통계학) > 데이터 시각화 > 서비스 개발 

                                          → 데이터가 가장 많은 곳은 ''이다. 

 

파이썬을 사용하려면??

# 컴파일러 프로그램 설치가 필요로 하다.  => 아나콘다 (확장기능 + 컴파일러 프로그램 + 코드 작성이 편리한 툴 을 한 번에 설치할 수 있는 프로그램)

 

 

 

 

문제1. print함수를 사용하여 3.141592 값을 출력하라. 단 소수점 첫 째자리만 출력하라.

#boolean 타입: True, False (접두사가 대문자)

 

문제2. 반지름(r=10)을 선언하고, 이를 이용하여 원의지름, 둘레, 넓이를 각각 출력해보세요.

 

 

🐶 입력

input사용방법

 

주피터 노트북은 맨 마지막에 쓴 값만 출력이 된다.
입력과 출력을 동시에하기

 

🐶 문자열

파이썬은 문자열을 다루는 기능이 쉽고 간단하다.

여러 줄의 문자열을 가져오는 경우는 따옴표 3개로 가져오면 된다.

"한 줄만 가능하다!!" => 한줄만 가능하다.

 

1. 변수이름.count(문자열): 해당 문자열에서 'to'가 몇 개 나왔는지 알아보자.

해당 기사에 to가 4번 나왔다.

2. len(변수 및 문자열): 문자가 몇 개인가?

 

3. 변수.find('찾고싶은문자'): 특정 문자의 인덱스를 뽑아낸다.

문자열 변수 안에 담긴 글 중에서 to가 언제 처음으로 나오는 인덱스는 몇 번쨰인가?

4.  변수.replace('기존문자', '변경할 문자'): 특정 문자열을 다른 문자열로 바꾼다.

문자열의 모든 to를 two로 변경한다.

5. 변수또는문자열.[시작인덱스: 마지막인덱스]: 슬라이싱

글자 개수는 마지막 인덱스 - 시작 인덱스 개수만큼 나온다!

시작인덱스는 무조건 나오지만 마지막인덱스는 나오지 않고, 마지막 인덱스의 바로 앞 문자까지만 출력됨!

 

 

6. 문자열또는변수.strip(): 문자열을 복사해서 가져오다 보면 이렇게 앞 뒤로 스페이스가 띄어져있는 경우가 많다. 이거를 없애고 싶다면? ↓

7. 변수또는문자열.format() : 변수 또는 문자열의 중괄호 부분에 내가 넣고자 하는 단어를 넣을 수 있다. 

대입 순서를 변경할 수도 있다.

 

소수점 세째자리에서 반올림한 결과가 출력이 된다.

format은 숫자의 형태도 변형할 수 있다!

참고, 한 번은 봐둘 필요가 있다.

 

🐶 문제

 

문제1. print 함수를 사용하여 3.141532값을 출력하라. (단, 소수점 아래 첫 번째 자리만 표시되도록 하세요.)

round사용
format사용

문제2. 문자열 '720'을 정수형으로 변환하라. 정수 100을 문자열 '100'으로 변환하라.

문제3. 밑이 6이고, 지수가 2일 때 거듭 제곱을 출력하라.

문제4. 사용자로 부터 두 개의 숫자를 받은 후 두 개의 숫자를 더한 값, 곱한 값, 나눈 값을 각각 출력하는 프로그램을 작성하여라.

문제5. 사용자로부터 두 개의 숫자를 입력받은 후 두 개의 숫자를 더한 값, 곱한 값, 나눈 몫, 나머지값을 각각 출력하는 프로그램을 작성하여라.

문제6. 사용자로부터 두 개의 숫자를 입력받은 후 두 개의 숫자를 더한 값, 곱한 값, 나눈 값, 나눈 몫, 나머지 값을 각각 다음과 같이 출력하는 프로그램을 작성하세요. 

* 단, 나눈 값은 소숫점 첫 번째 자리만 출력하세요.

 

🐶 정리

1. count(문자열): 해당 문자열이 몇 번 나왔어???
2. len(문자열): 해당 문자열이 몇 글자야?
3. .find('단어'): 앞 문자열 또는 변수에서 찾고 싶은 단어
4. .replace('기존','대체'): 대체할 문자
5. [시작인덱스:마지막인덱스]: 마지막인덱스 - 시작인덱스 만큼 글자를 뽑아냄.
6. .strip('제거하고자하는 문자'): 공백이면 스페이스바 제거
7. .format(): 중괄호를 대체할 문자
7-1. format(부동소수점, ".2f"): 소수점 둘 쨰자리까지만 출력을 한다.

'Python' 카테고리의 다른 글

[입문]감잡기-데이터 구조  (0) 2023.09.15
[입문]감잡기-반복문  (0) 2023.09.11
[입문]감잡기-조건문  (0) 2023.09.08
[입문] 감잡기 - 리스트  (0) 2023.09.08