728x90
반응형

gpt 2

[Day5] 한 권으로 LLM 온라인 스터디 1기 - GPT, Gemma, Llama3 모델 특징 비교

3.2 Gemma와 Llama3 모델 구조 분석 3.2.1 Gemma 모델 구조 분석매개변수(7B, 13B, 34B, 72B 등)의 수를 늘려서 성능을 높이는데 집중했던 재부분의 모델들과는 반대로 모델의 크기를 크게 줄여서 고성능 컴퓨팅 자원이 부족한 환경에서도 언어모델을 황용할 수 있게 하려는 혁신적인 시도a. input_layernorm, post_attention_layernorm 추가 : 그레디언트를 적절한 크기로 유지 → 안정적 학습, 더 좋은 성능b. RoPE(Rotary Position Embedding) 도입 : 각 토큰의 위치를 상대적인 각도로 표시c. 활성화 함수 : ReLU의 한계를 극복하기 위해 GELU와 GLU를 결합한 GeGLU라는 새로운 활성화 함수를 사용  3.2.2 Gemm..

프로그래밍/LLM 2025.01.25

비탈릭 부테린, 이더리움 동물 자선단체에 기부

기사내용 :  이더리움의 공동 창립자인 비탈릭 부테린이 비영리 동물 자선단체에 상당량의 이더리움(ETH)을 기부했습니다. 이는 암호화폐 커뮤니티 내에서 인간과 동물의 복지 문제에 대한 관심을 높이고, 블록체인 기술을 이용한 사회적 기여의 긍정적인 사례로 주목받고 있습니다. 부테린의 이번 기부는 블록체인 기술의 다양한 활용 가능성과 그 장점을 알리는 데 기여할 것입니다. 시장에 미치는 영향 :  비탈릭 부테린의 기부는 암호화폐 시장에 긍정적인 영향을 미칠 것으로 예상됩니다. 과거에도 주요 인물의 기부나 사회적 기여는 암호화폐의 인식 개선과 신뢰도 향상에 기여해왔습니다. 이는 투자자들 사이에서 이더리움의 가치와 지속 가능성에 대한 긍정적인 평가로 이어질 수 있으며, 단기적으로 이더리움 가격의 상승 요인으로 ..

코인 뉴스 2024.08.15
728x90
반응형