π€ Reddit
r/MachineLearning
Bulding my own Diffusion Language Model from scratch was easier than I thought [P]
DiffusionModel AI LanguageModel MachineLearning
π AI Summary
ν μ¬μ©μκ° AI μ½λ λμ μμ΄ μ§μ Diffusion Language Modelμ ꡬννλ νλ‘μ νΈλ₯Ό μ§ννμΌλ©°, Karpathyμ μμ Shakespeare λ°μ΄ν°μ
μΌλ‘ MacBook Air M2μμ λͺ μκ° λμ νμ΅μν¨ κ²°κ³Όλ₯Ό 곡μ νμ΅λλ€. νλ‘μ νΈλ₯Ό ν΅ν΄ Diffusion λͺ¨λΈμ κΈ°λ³Έ κ°λ
μ μ΄ν΄νλ λ° λμμ΄ λμμΌλ©°, λ€λ₯Έ μ¬μ©μλ€λ λΉμ·ν νλ‘μ νΈμ κ΄μ¬μ 보μμ΅λλ€.
π Key Discussion Points
- β’ AI μ½λ λμ μμ΄ Diffusion Language Modelμ μ²μλΆν° ꡬννλ νλ‘μ νΈλ₯Ό μ§νν¨.
- β’ 7.5M νλΌλ―Έν° λͺ¨λΈμ Karpathyμ Shakespeare λ°μ΄ν°μ μΌλ‘ MacBook Air M2μμ λͺ μκ° λμ νμ΅μν΄.
- β’ νλ‘μ νΈλ₯Ό ν΅ν΄ (discrete) diffusion, encoder, decoder, tokenizerμ κ°μ κ°λ μ μ΄ν΄νλ λ° λμμ΄ λμλ€κ³ μΈκΈν¨.