Artificial Intelligence
https://learning.oreilly.com/library/view/hands-on-generative-ai/9781098149239/cover.html Hands-On Generative AI with Transformers and Diffusion Models- Selection from Hands-On Generative AI with Transformers and Diffusion Models [Book]www.oreilly.com본 포스팅이 문제가 될 시 삭제하겠습니다. 본 Hands-On Generative AI with Transformers and Diffusion Models에 대한 Ebook을 hands-on 해보고 리뷰를 남기려합니다. 최근 diffusion models과 st..
🧑🏻💻용어 정리 Computer vision Quantization Pruning Quantization & Pruning 이 Quantization이 왜 필요할까요? 결국 나오게 된 이유는, computation과 memory를 조금만 사용하면서 비슷한 accuracy를 내고싶다는 것입니다. 이것이 가장 큰 욕망이죠. 한편, CNN이 MLP 보다 우수한 이유는, MLP는 edge 개수만큼의 parameter의 개수가 요구되지만, CNN은 일부의 parameter sharing 등의 성질로 인하여 memory를 조금 사용합니다. 그리고 spare connection을 통해 조금의 weighted summation을 한다는 것입니다. 있습니다. 따라서, 이러한 기법을 사용할 때는 항상 세심한 주의를 기울..
🧑🏻💻용어 정리 Computer vision Color image RGB fullcolor HSV YIQ YUV 지금까지 우리는 Gray Scale의 image들에 대해 다뤘습니다. 이제 Color image processing에 대해 다뤄보죠. Color image processing 실제로 color image가 많이 처리되죠. 지금까지 다룬 흑백은 밝기를 의미하는 것이라고 볼 수 있습니다. 사람은 밝기에 대해 색상처럼 민감하진 않습니다. 사람의 시각은 색상을 잘 구별합니다. 위 사진은 전자기파의 파장에 따른 선을 나타낸 것입니다. 그 중에 사람 눈에 보이는 것이 가시광선 구간입니다. 이렇게 파장에 따라 색이 위와 같이 구분됩니다. 이정도 교양으로 알고 넘어가시면 되겠습니다. 가로축은 파장입니다..
🧑🏻💻용어 정리 Deep Generative Models Generative Model Generative Adversarial Nets (GAN) 이번 시간에는 GAN에 대해 다루겠습니다. Generative Adversarial Nets (GAN) 이 GAN은 번역하면 적대적 생성 신경망 모델로 직역을 합니다. 2014년 정도에 나왔습니다. 우선 두 명의 플레이어가 있다고 봅시다. 탐정, 위조범. 그리고 2개의 데이터가 있습니다. 미술품과 모조품. 탐정은 미술품인지 모조품인지 분간해냅니다. 반대로 위조범은 탐정을 속입니다. 위조범은 모조품을 진품인 것처럼 평가받아야합니다. 처음에는 학습이 잘 되지 않아, 둘 다 멍청합니다. 그런데, 계속해서 모조품을 잘 찾아내기 위해, 더 잘 속이기 위해 둘 다 공..
🧑🏻💻용어 정리 Computer vision Image Warping Forward warping Backward inverse warping bilinear interpolation transformation 우리가 지금까지는 Transformation의 종류에 대해 배워봤습니다. Forward warping 위와 같은 2D Transformation을 위한 연산으로 행렬 M으로 표현한다고 했습니다. 이 3 x 3 Matrix인 M을 원본 image의 각 좌표에 곱해주게 되면, 각 pixel에 대해 이동시킨 각 pixel을 얻을 수 있다고 하였습니다. 이제 그 좌표 정보가 우리에게 있다고 했을 때, 해당 이미지를 해당되는 변환된 위치로 변환하는 작업을 해보겠습니다. 위 그림에서, 원본 이미지 f에 ..
🧑🏻💻용어 정리 Computer vision Image Warping Non-Linear Transformation Homogeneous coordinates scaling rotation shearing translation matrix composition Euclidean similarity rigid Affine 이전 시간에는 scaling, shear, rotation 등 linear transformation에 대해 알아보았습니다. 이번에는 non-linear transformation에 대해 알아보겠습니다. Image Warping 먼저 2D translation에 대해 알아보겠습니다. 이것은 non-linear transformation입니다. 위 사진에 대해 다음과 같이 바뀌는 위치를..
🧑🏻💻용어 정리 Deep Generative Models Generative Model Discriminative Model pre-training fine-tunning DBN VAE encoder autoencoder reparametrization trick 이번에는 Deep Generative Models이라 불리는 생성 모델에 대해 보겠습니다. Deep Generative Models 이 Generative Model은 생성 모델, '생성하는 모델'입니다. 즉, data를 생성할 수 있는 모델을 의미합니다. 우리는 평균과 분산을 가지는 확률 분포에 의해 data를 무한히 생성해낼 수 있습니다. 이것으로부터 sampling, generation 등으로 부릅니다. 만약 우리가 N(0, 1)과 같은..
🧑🏻💻용어 정리 Computer vision Image Warping Linear Transformation scaling rotation shear geometric transformation rectification stabilization stitch 오늘 배울 것은 Image Warping입니다. Image Warping 이 Image Warping는 그냥 image를 비틀어준다는 것을 의미합니다. 즉, 기하학적인 변화를 통해 image를 비트는 것을 의미하죠. 아래 사진과 같은 T라는 geometric transform에 의해 변환합니다. 그래서 아래와 같은 것들도 warping을 통해 이루어집니다. - Image rectification - Video stabilization - Image ..
🧑🏻💻용어 정리 Computer vision Image Restoration noise Gaussian Noise Bilateral Filter Weight Adaptive Filtering Nonlocal Means 이전 시간에는 Adaptive filtering 중에서도 wiener filtering에 대해 알아보았습니다. 이것은 denoising이라는 궁극적인 목표에 만족할만한 성과를 가져오진 않았습니다. 그리고 salt and pepper noise, gaussian noise 등 이것에 특화된 방법으로 우리가 denosing method를 적용해야함을 다시 한 번 말씀드리고 들어가겠습니다. 새로운 filter입니다. 이 Bilateral Filter는 Gaussian Filter에서 시작했습니..