Activation Steering
기존에는 LLM의 행동을 제어하는 방법은 주로 프롬프팅이었다. 사용자가 원하는 스타일로 답변받으려면 프롬프트를 정교하게 작성해야 했고, 이를 따를지 말지는 온전히 모델의 선택이었다. 하지만 최근 주목받는 Activation Steering 기법은 이 패러다임을 바꾼다.
기존에는 LLM의 행동을 제어하는 방법은 주로 프롬프팅이었다. 사용자가 원하는 스타일로 답변받으려면 프롬프트를 정교하게 작성해야 했고, 이를 따를지 말지는 온전히 모델의 선택이었다. 하지만 최근 주목받는 Activation Steering 기법은 이 패러다임을 바꾼다.
머신러닝과 비교하여 딥러닝 모델의 가장 큰 문제는 모델이 왜 이런 결과를 만들어냈는지 해석할 수 없다는 것이고 이를 ‘Black Box Problem’이라고 한다. 그리고 이 Black Box 문제를 해결해보고자 예전부터 XAI(eXplainable AI)에 관한 연구가 활발한데 ...
RetinaNet은 one stage detector의 대표주자인 YOLO, SSD보다 높은 성능을 기록하면서 Faster R-CNN보다 빠른 수행시간을 기록한 모델이다. 특히, 작은 object에 대한 detection 능력도 뛰어난데 이번 포스팅에서는 이 RetinaNet에 대...
R-CNN이 다른 모델들에 비해 높은 mAP를 기록했고 이후 Fast-RCNN, Faster R-CNN, Mask R-CNN 등 여러 모델들이 R-CNN을 develop하여 object detection 분야에서 더 많은 발전을 이루어냈다. 이번 포스팅에서는 R-CNN 이후의 모델...
Computer vision 분야의 발달로 네트워크의 층을 더해 정확도를 높이면서 연산량을 줄여 속도는 높이는 방법들이 고안되었다. 이 과정속에서 네트워크의 깊이와 높이, 이미지의 크기, 필터의 채널 수 등 다양한 파라미터들이 실험적으로 사용되었는데 EfficientNet과 Eff...