본문 바로가기

Vision11

AlexNet 에서 2015년 ResNet 으로의 발전 2011년 발표된 AlexNet에서 2015년 **ResNet(Residual Network, Deep Residual Learning)**이 나오기까지 CNN(Convolutional Neural Network)의 발전 과정에서 중요한 연구들이 진행되었으며, ResNet은 이러한 문제를 해결하고 더욱 강력한 성능을 보여준 모델이다.1. AlexNet(2011)의 한계점AlexNet은 딥러닝을 대중화한 첫 번째 모델이었지만, 몇 가지 한계가 있었다.1. 더 깊은 네트워크를 만들기 어려움AlexNet(8층) 이후 VGGNet(2014, 16~19층) 같은 더 깊은 네트워크가 등장했지만, 깊이가 증가할수록 기울기 소실(Vanishing Gradient) 문제가 심각해짐.층을 깊게 쌓아도 성능이 향상되지 않거.. 2025. 2. 3.
2011년 AlexNet 과 2006년 Hinton, Bengio 교수 연구차이 비교 2011년 ImageNet 대회에서 Alex Krizhevsky가 개발한 AlexNet은 당시까지의 컴퓨터 비전 성능을 극적으로 개선한 모델이다. 특히 2006년 Hinton과 Bengio 교수가 발표한 논문에서 제기된 초기값 설정의 중요성 문제와 비교하여 여러 가지 면에서 개선이 이루어졌다.1. 2006년 Hinton & Bengio의 논문과 문제점2006년 Geoffrey Hinton과 Yoshua Bengio 교수는 심층 신경망(Deep Neural Network, DNN)의 학습이 어려운 주요 원인을 분석한 논문을 발표했다.당시 DNN은 층이 깊어질수록 학습이 제대로 이루어지지 않았는데, 이는 기울기 소실(Vanishing Gradient) 문제 때문이었다.논문에서는 **가중치 초기화(Weight.. 2025. 2. 3.
[Tip] Google Colab 환경에서 Argumentparser 사용 ArgumentParse 란 ? 코드를 실행할 때, 하나의 Script 내에서 분명 다양한 상황들이 존재할 겁니다. 그 때마다 일일이 지정하기 번거로우니 여러 상황에 따라 'argparse' 를 불러와 (호출), 호출 시 인자(argument)값을 할당하할 수 있다고 합니다. 그래서 argparse를 이용하면 다양한 유형의 인자값들을 효율적으로 처리할 수 있기 때문에, 복잡한 모델을 다룰 때 굉장히 편리하다고 하네요. Argparse 의 사용 예시는 아래의 링크 참고 ! https://engineer-mole.tistory.com/213 [python] ArgumentParser 사용법 개요 Python의 실행시에 커맨드 라인 인수를 다룰 때, ArgumentParser(argparse)를 사용하면 편리.. 2023. 7. 3.
Image Inpainting for Irregular Holes Using Partial Convolutions 보호되어 있는 글 입니다. 2023. 6. 28.
[ML] 초간단 ML History 1 #1 근자감1958년, 코넬 Aeronautical Lab 에서 인지학자로 연구하던 Frank Rosenblatt 박사는 인간의 뉴론을 흉내 낸 당시의 Computer System을 보고는...  곧, 걷고, 말하고, 보고, 쓸 수 있으며, 스스로 재생산 해 낼 수 있는 장치가 나타날 것 이라고 주장한다. 이 기사는 당시 뉴욕 타임스에까지 실리면서,  사람들에게 인공지능의 미래에 대해 근자감을 심어주게 된다.  #2 지나친 비판론자이렇게 희망적이던 인공지능에 대한 연구는 1969년 MIT AI Lab 책임자였던 Marvin Minsky 교수에 의해 박살나는데,이 분은, 뉴론을 본 뜬 인공지능 신경망이 XOR 문제를 풀 수 없을 거라는 것을 증명하며,  No one on earch had found a v.. 2023. 6. 23.
GAN (Generative Adversarial Networks ) ( 참고! 최초의 GAN이 발표된 이후, GAN 의 개념을 이용한 다양한 모델들이 나왔는데, VanillaGAN 은 최초의 GAN model입니다. 본 포스팅에서는 편의상 GAN 이라고 하겠습니다. ) ( GAN paper ↓↓ ) https://arxiv.org/abs/1406.2661 Generative Adversarial Networks We propose a new framework for estimating generative models via an adversarial process, in which we simultaneously train two models: a generative model G that captures the data distribution, and a discrim.. 2023. 6. 20.