2023년 4월 3주차
https://arxiv.org/abs/2304.04487
Inference with Reference: Lossless Acceleration of Large Language Models (Nan Yang, Tao Ge, Liang Wang, Binxing Jiao, Daxin Jiang, Linjun Yang, Rangan Majumder, Furu Wei)
llm 디코딩 가속. lm에서 생성한 토큰들 중 마지막 N개와 매칭되는 레퍼런스 문서의 시퀀스가 있는지 확인하고, 시퀀스가 있다면 가져와서 lm에 입력으로 넣은 뒤 argmax를 해서 lm의 출력과 consistent한지 체크하고 consistent한 토큰들을 생성 토큰으로 출력. speculative decoding에서 모델을 따로 쓰는 대신 retrieval로 해결했다는 느낌이네요.
#efficiency #llm
https://arxiv.org/abs/2304.05302
RRHF: Rank Responses to Align Language Models with Human Feedback without tears (Zheng Yuan, Hongyi Yuan, Chuanqi Tan, Wei Wang, Songfang Huang, Fei Huang)
PPO 대신 reward로 ranking을 만들어 ranking loss를 적용하는 방법이군요. 세팅이 심플해지고 성능은 PPO를 쓰는 쪽과 비슷하다는 것이 요점입니다.
#alignment #llm
https://arxiv.org/abs/2304.06706
Zip-NeRF: Anti-Aliased Grid-Based Neural Radiance Fields (Jonathan T. Barron, Ben Mildenhall, Dor Verbin, Pratul P. Srinivasan, Peter Hedman)
마침 연산 자원이 부족한 상황에서 가장 유망해보이는 분야 nerf...에서 또 굉장한 결과가 하나 나왔군요. instant ngp 같은 그리드 기반 방법을 antialiasing해서 기존의 antialiasing (mip-nerf) 방법보다 더 고속으로 학습하고 퀄리티도 향상됐군요.
https://jonbarron.info/zipnerf/
#nerf #antialiasing
https://arxiv.org/abs/2304.07193
DINOv2: Learning Robust Visual Features without Supervision (Maxime Oquab, Timothée Darcet, Théo Moutakanni, Huy Vo, Marc Szafraniec, Vasil Khalidov, Pierre Fernandez, Daniel Haziza, Francisco Massa, Alaaeldin El-Nouby, Mahmoud Assran, Nicolas Ballas, Wojciech Galuba, Russell Howes, Po-Yao Huang, Shang-Wen Li, Ishan Misra, Michael Rabbat, Vasu Sharma, Gabriel Synnaeve, Hu Xu, Hervé Jegou, Julien Mairal, Patrick Labatut, Armand Joulin, Piotr Bojanowski)
dino와 추가 objective + regularizer, 거르고 걸러서 142M 규모로 축소한 데이터셋으로 학습 및 distill. linear probing으로 각종 벤치마크를 제압하고 dino의 특징인 object separation도 잘 보이는군요. linear probing으로 수행한 depth estimation도 인상적이네요.
비전 업계가 데이터 필터링에 좀 짰던 측면이 있다고 할 수 있지 않을까요? 이 논문에 쓰인 데이터 큐레이션 방법, 모델 튜닝, 학습 코드 효율화는 계속 참고할 대상이 되지 않을까 싶습니다.
#contrastive_learning
https://arxiv.org/abs/2304.07327
OpenAssistant Conversations -- Democratizing Large Language Model Alignment (Andreas Köpf, Yannic Kilcher, Dimitri von Rütte, Sotiris Anagnostidis, Zhi-Rui Tam, Keith Stevens, Abdullah Barhoum, Nguyen Minh Duc, Oliver Stanley, Richárd Nagyfi, Shahul ES, Sameer Suri, David Glushkov, Arnav Dantuluri, Andrew Maguire, Christoph Schuhmann, Huu Nguyen, Alexander Mattick)