Orange3 4

Tree 위젯과 Tree View 위젯

Tree 위젯과 Tree View 위젯 150개의 인스턴스가 있음을 확인할 수 있다. 각 변수들에 따라서 어떻게 그래프가 분포되어 있는지 확인할 수 있다. boxplot에서도 수치들의 분포를 살펴볼 수 있었지만, distributions에서도 막대그래프의 형태로 수치의 분포를 살펴볼 수 있다. 여기서는 전처리는 하지 않고, data set만 연결을 하였다. 그리고 출력으로는 의사결정 tree학습 알고리즘인 learner와 잘 훈련된 모델이 나올 수 있다. 여기서 우리는 여러 가지 값들을 세팅해볼 수 있는데, tree의 이름은 기본적으로 tree라고 되어 있고, 이름은 변경이 가능하다. Induce binary tree: 이진트리 형태로 분할을 한다. 즉 자식노드가 두 개가 있다. Min, number o..

Orange3 2023.08.01

수치형 데이터 다루기 - 지도학습(분류)

지도학습(분류): 붓꽃데이터 분석 지도학습(분류): 붓꽃데이터 분석 target 값이 이산적인 값이거나 범주형 데이터일때 수행할 수 있다. 즉 이 데이터가 A에 속하느냐 또는 B에 속하느냐를 판별하는 것이다. Orange에서 제공하고 있는 tab data set 우리가 앞전에 사용했던 housing data는 tab데이터로 구별되어 있다. 여기에는 이 속성의 이름을 나타내는 행이 가장 먼저 있고, 그 다음 속성의 타임, 종류를 나타내는 행이 있다. 그리고 나머지는 데이터들이다. 속성에서 c는 연속적인 숫자, d는 이산적/ 범주형 데이터, s는 string(문자열)을 의미한다. 우리가 앞 전에 target값은 mdev 중앙값으로, 이런 경우에 regression을 수행한다. 그리고 kinds(종류)에는 c..

Orange3 2023.08.01

수치형 데이터 - 지도학습(회귀)

지도학습(회귀): 선형회귀모델 1. 파일 위젯을 끌여다가 더블클릭 Data Table을 이용하면 file의 데이터 모양을 확인할 수 있다. 파일에 저장된 데이터의 산점도도 확인할 수 있다. 선형회귀도 확인한다. 선형회귀 모델에 들어가는 데이터는 아까 우리가 만든 train.csv데이터이고, 클릭하면 위 전체적인 의미는 train데이터를 가지고 선형 회귀를 시행했을떄, 그렇게 생성된 모델에 새로운 데이터를 넣으면 어떤 결과가 나올지 연결을 하는 것 우리는 이미 예측값이 무엇인지 알고 있지만, 이것을 다시 시각화해서 살펴본다. predictions에서 나오는 값을 산점도에 넣어주면 결과를 시각적으로 확인할 수 있다. 입력값이 binary형태로만 받는 베이즈 모델의 경우는 이산형 변수 데이터를 가진 train..

Orange3 2023.07.31

Orange3 실행 환경 구성

Orange3 소개 orange3라는 툴을 이용해서 마우스 클릭 만으로 숫자, 텍스트, 이미지 등과 같은 데이터 분석이 가능하다. 이것을 시각화해서 살펴볼 수 있다. 여러가지 머신러닝 모델을 활용해서 데이터를 비교분석할 수도 있다. 초등학생도 사용가능할 만큼 쉽다. 시각적으로 위젯 하나하나를 연결시켜서 코딩을 할 수 있다. Orange3 사용방법 shortcut은 바탕화면에 생기는 단축 아이콘으로 아이콘만 클릭해도 프로그램을 실행시킬 수 있다. 1. 파일: 새로운 파일 만들거나, 열거나, 저장한다. 2. 편집: 아무것도 작성하지 않으면, 활성화되지 않고 우리가 흔히 사용하는 복사, 붙여넣기, 모두 선택하기, 삭제하기 등 수정 작업들을 수행한다. (undo는 방금전 작업을 취소함, redo는 방금전 취소한..

Orange3 2023.07.31