빅데이터 2

수치형 데이터 다루기 - 지도학습(분류)

지도학습(분류): 붓꽃데이터 분석 지도학습(분류): 붓꽃데이터 분석 target 값이 이산적인 값이거나 범주형 데이터일때 수행할 수 있다. 즉 이 데이터가 A에 속하느냐 또는 B에 속하느냐를 판별하는 것이다. Orange에서 제공하고 있는 tab data set 우리가 앞전에 사용했던 housing data는 tab데이터로 구별되어 있다. 여기에는 이 속성의 이름을 나타내는 행이 가장 먼저 있고, 그 다음 속성의 타임, 종류를 나타내는 행이 있다. 그리고 나머지는 데이터들이다. 속성에서 c는 연속적인 숫자, d는 이산적/ 범주형 데이터, s는 string(문자열)을 의미한다. 우리가 앞 전에 target값은 mdev 중앙값으로, 이런 경우에 regression을 수행한다. 그리고 kinds(종류)에는 c..

Orange3 2023.08.01

Orange3 실행 환경 구성

Orange3 소개 orange3라는 툴을 이용해서 마우스 클릭 만으로 숫자, 텍스트, 이미지 등과 같은 데이터 분석이 가능하다. 이것을 시각화해서 살펴볼 수 있다. 여러가지 머신러닝 모델을 활용해서 데이터를 비교분석할 수도 있다. 초등학생도 사용가능할 만큼 쉽다. 시각적으로 위젯 하나하나를 연결시켜서 코딩을 할 수 있다. Orange3 사용방법 shortcut은 바탕화면에 생기는 단축 아이콘으로 아이콘만 클릭해도 프로그램을 실행시킬 수 있다. 1. 파일: 새로운 파일 만들거나, 열거나, 저장한다. 2. 편집: 아무것도 작성하지 않으면, 활성화되지 않고 우리가 흔히 사용하는 복사, 붙여넣기, 모두 선택하기, 삭제하기 등 수정 작업들을 수행한다. (undo는 방금전 작업을 취소함, redo는 방금전 취소한..

Orange3 2023.07.31