GAN 3

[아이디어] Generating Tabular Data using GAN Framework

[ 목차 ]이번 게시글에는 수업시간에 조원들과 만든 새로운 모델(Tabular data 생성)을 다뤄보겠습니다. 그리고 나서 기존의 Tabular data 생성하는 모델인 CTGAN과 비교하며 겪었던 한계를 서술하겠습니다.Introduction이 모델은 Tabular data를 생성하는 CTGAN모델에서 이미지 데이터를 생성하는 InfoGAN 모델을 결합했기 때문에 CTGAN, InfoGAN에 대한 모델에 대해서 어느정도 이해가 필요할 것 같습니다. [아래 링크는 InfoGAN,CTGAN 모델에 대해서 정리한 글입니다. 참고하시면 도움이 될 것 같습니다.]InfoGAN : https://enjoy0life.tistory.com/7CTGAN : https://enjoy0life.tistory.com/10 ..

아이디어 2024.09.14

[CTGAN] Modeling Tabular Data using Conditional GAN

[ 목차 ]  오늘은 2019년 NeurIPS에서 발표된 CTGAN 논문을 리뷰해 보겠습니다. AbstractTabular data란 Discrete(이산형) columns, Continuous(연속형) columns을 갖고있는 데이터입니다.Continuous columns은 multiple modes(여러개의 봉우리)를 가지고 있으며 Discrete columns은 각 카테고리 수가 불균형(암 환자 : 5%, 정상 환자 : 95%)하게 되어있으면 Deep neural network 모델은 모델링 하는데 어려움을 겪습니다.저자는 CTGAN이라는 모델을 제안했으며 이 모델은 위에서 제시한 문제점을 해결하기 위해 Conditional Generator를 사용한다고 합니다. 모델이 어떤 구조인지 살펴보도록 하..

[InfoGAN] Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets

[ 목차 ]오늘은 2016년에 NeurIPS에 발표된 InfoGAN이라는 논문을 리뷰해 보겠습니다.1. InfoGAN이란?InfoGAN이란 기존의 GAN 모델에서 정보이론(information-theoretic)의 개념을 추가하여 Disentangled representation을 학습할 수 있도록 하는 모델입니다. Disentangled representation이란? 데이터의 특징(feature)이나 변수가 서로 분리되어 표현된다는 것을 의미합니다.사람의 얼굴 이미지를 다룬다고 할때 사람의 표정, 눈 색상, 헤어스타일, 선글라스 유무, 숫자 이미지를 다룬다고 할때 숫자의 크기, 두께(thickness), 각도(angle) 등의 특징이 분리되어 표현된다면 disentangled representatio..