-
๋ฌ์คํธ genai
-
CUDA์ฌ๊ธฐ์ ์ ๋ฆฌ์ค.
-
๋จธ์ ๋ฌ๋ Tutorial
- ๋จธ์ ๋ฌ๋๊ธฐ์ด
- ์ธ๋ถ๋งํฌ)๋ด๋ด๋คํธ์ํฌ๋ผ๋๊ฑธ ๋ค์ด ๋ณด์ จ๋ค๋ฉด ๋ณด์ ์ผ ํ ์์. - DL1 | 3Blue1Brown ํ๊ตญ์ด
- ์ธ๋ถ๋งํฌ)250423 Essential Machine Learning and AI Concepts Animated | freeCodeCamp.org
- (์ธ๋ถ๋งํฌ250531)AI๊ฐ ๊ถ๊ธํ๋ค๋ฉด ๋ด์ผํ ๊ธฐ์ด์์ ๊ฒฝ์ฌํ๊ฐ๋ฒ - DL2 | 3Blue1Brown ํ๊ตญ์ด
-
์ธ๋ถ๋งํฌ)๋จธ์ ๋ฌ๋ ๊ธฐ์ด ์ํhttps://mml-book.github.io/book/mml-book.pdf
-
์ด๋ณด์๋ฅผ ์ํ Vector Embeddings ๊ฐ์ด๋ (timescale.com)
-
๋จธ์ ๋ฌ๋ ์ฐ๊ตฌ ์๋ฃ๊ฐ ์ ์ ๋ฆฌ๋จ.https://www.natolambert.com/writing/debugging-mbrl
-
์ธ๋ถ๋งํฌ)๋จธ์ ๋ฌ๋ ๋ ผ๋ฌธ์ ๋ฆฌ ์๋ ์ฑ๋_์์ปค๋ฐ
-
DeekSeek๋ถ์ ์๋ฃ
-
(์ธ๋ถ๋งํฌ) 250320_What Are AI Agents Really About? | ByteByteGo
-
(์ธ๋ถ๋งํฌ) 250219 What is MCP? Integrate AI Agents with Databases & APIs | IBM Technology
-
250419_Microsoft, CPU์์ ์คํ๊ฐ๋ฅํ ์ด๊ณ ํจ์จ AI ๋ชจ๋ธ BitNet ๊ฐ๋ฐ
- ๋ฌ์คํธRust๋ก ๊ตฌํํ ๋จธ์ ๋ฌ๋
-
C++๋ก ๊ตฌํํ ๋จธ์ ๋ฌ๋
-
C๋ก ๊ตฌํํ ๋จธ์ ๋ฌ๋
- (์ธ๋ถ๋งํฌ)Stanford Seminar - Physical Intelligence and Cognitive Biases Toward AI | Stanford Online
- (์ธ๋ถ๋งํฌ)250304_Deep Learning Day: Generative Modeling | MIT Schwarzman College of Computing
- (์ธ๋ถ๋งํฌ)250311 MIT 6.S191: Recurrent Neural Networks, Transformers, and Attention | Alexander Amini
- (์ธ๋ถ๋งํฌ)230823 What is Retrieval-Augmented Generation (RAG)? | IBM Technology
-
(250429) NVIDIAโs New AI: Impossible Ray Tracing! Two Minute Papers
-
(241001)Should you use Rust in LLM based tools for performance?
-
(240308)๋ฉํ๋ ์ค๋น๋์ด ์๋ค | LLM์ ํ๊ณ, JEPA | Endplan : AI ์ธ์ฌ์ดํธ
๐ Making Rust a first-class language and ecosystem for GPU shaders ๐ง|๐|
- GPU๋ ์ฐ์ฐ ์๋๊ฐ ๋ฉ๋ชจ๋ฆฌ ์ ๊ทผ ์๋๋ณด๋ค ์๋ฑํ ๋นจ๋ผ์, ๋ฉ๋ชจ๋ฆฌ ๊ณ์ธต ๊ตฌ์กฐ๊ฐ ์ฑ๋ฅ์ ๋ณ๋ชฉ์ ์ผ์ผํด
- ์ฐ์ฐ ์ง์ฝ๋(Arithmetic Intensity, AI) ์ ๋ฐ๋ผ ์ฐ์ฐ์ด ๋ฉ๋ชจ๋ฆฌ ๋ฐ์ด๋, ๊ณ์ฐ ๋ฐ์ด๋ ์ํ๋ก ๊ตฌ๋ถ๋๋ฉฐ, A100 GPU์ ์๊ณ์ ์ ์ฝ 13 FLOPs/Byte์
- ์ฑ๋ฅ ์ต์ ํ ์ฃผ์ ์ ๋ต์ผ๋ก ์ฐ์ฐ ํฉ์น๊ธฐ(Fusioโฆ
๋จธ์ ๋ฌ๋ ์ ์ฉ TPU(TPU ์ฌ์ธต ๋ถ์)|๐|
- 250623TPU ์ฌ์ธต ๋ถ์
- TPU๋ ๊ตฌ๊ธ์ด ๊ฐ๋ฐํ ๋๊ท๋ชจ AI ํ์ต ๋ฐ ์ถ๋ก ์ฉ ๋ง์ถคํ ์นฉ์ผ๋ก, GPU์๋ ๋ค๋ฅธ ์ค๊ณ ์ฒ ํ์ ๊ฐ์ง๊ณ ์์
- ํ์ฅ์ฑ๊ณผ ์๋์ง ํจ์จ์ฑ์ ๊ฐ์กฐํ๋ฉฐ, ํ๋์จ์ด(์: ์์คํ ์จ์นฉ ๊ตฌ์ฑ, ๋ํ ์จ์นฉ ๋ฉ๋ชจ๋ฆฌ)์ ์ํํธ์จ์ด(** XLA ์ปดํ์ผ๋ฌ**)๋ฅผ ํจ๊ป ์ค๊ณํจ
- ํต์ฌ ๊ตฌ์กฐ๋ ์์คํจ๋ฆญ ์ด๋ ์ด์ ํโฆ
Cuda(nvidia์ ์ฉ๋๋ณ ์ ๋ฆฌ|๐|
- 55๋ถ ๋ถํฐ ๋ณด๋ฉด ์ ์ ๋ฆฌ๋จ
cuPYNUMERIC | NUMERICAL COMPUTING |
cuLITHO | COMPUTATIONAL LITHOGRAPHY |
AERIAL | 5G/6G SIGNAL PROCESSING |
cuOPT | DECISION OPTIMIZATION |
PARABRICK | GENE SEQUENCING |
MONAI | MEDICAL IMAGING ๋ฌธ์ https://docs.monai.io/en/stable/networks.html |
EARTH-2 | WEATHER ANALYTICS |
cuQUANTUM CUDA-Q |
QUANTUM COMPUTING |
cuEQUIVARIANCE cuTENSOR |
QUANTUM CHEMISTRY |
- ๊น๋ํ๊ฒ ๊ธ๋ก ์ ๋ฆฌ ๋จ
- DeepSeek ํ์ด ๋ด๋ถ ์ถ๋ก ์์ง(DeepSeek Inference Engine)์ ์คํ์์ค๋ก ํ์ํ๊ธฐ ์ํ ๊ณํ์ ๊ณต๊ฐํจ
- ๊ธฐ์กด์ ์ถ๋ก ์์ง์ vLLM ๊ธฐ๋ฐ์ด๋ฉฐ, DeepSeek-V3 ๋ฐ R1 ๋ชจ๋ธ์ ๋ฐฐํฌ ์์ ์ฆ๊ฐ์ ๋ฐ๋ผ ๊ณต์ ๋ฅผ ๊ณ ๋ ค์ค
- ๊ธฐ์กด ์ฝ๋์ ์ธํ๋ผ ์ข ์์ฑ, ์ ์ง๋ณด์ ๋ถ๋ด ๋ฑ์ผ๋ก ์ ์ฒด ๊ณต๊ฐ๋ ์ด๋ ค์, ๋์ **๋ชจ๋ํ ๋ฐ ๊ธฐโฆ
- 3FS๋ DeepSeek๊ฐ ๊ฐ๋ฐํ ๊ณ ์ฑ๋ฅ ์คํ์์ค ๋ถ์ฐ ํ์ผ ์์คํ ์ผ๋ก, ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ๋์ ์ฒ๋ฆฌ๋์ ์ง์ํจ
- ์ผ๋ฐ์ ์ธ ํ์ผ ์์คํ ์ฒ๋ผ ๋์ํ์ง๋ง, ์ค์ ๋ก๋ ์ฌ๋ฌ ๋จธ์ ์ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ฐ ์ ์ฅํ๋ฉฐ ์ฌ์ฉ์๋ ์ด๋ฅผ ์์ํ์ง ์์๋ ๋๋ ์ถ์ํ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง
- **4๊ฐ์ง ์ฃผ์ ๊ตฌ์ฑ ์์ (Meta, Mgmtd, Stoโฆ
โฒDeepSeek, 3FS ํ์ผ์์คํ ๊ณผ Smallpond ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ๋ ์์ํฌ ์คํ์์ค ๊ณต๊ฐ (5 of 5) (github.com/deepseek-ai)|๐|
- 250228
- Fire-Flyer File System(3FS)๋ AI ํ์ต ๋ฐ ์ถ๋ก ์ํฌ๋ก๋๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํด ์ค๊ณ๋ ๊ณ ์ฑ๋ฅ ๋ถ์ฐ ํ์ผ ์์คํ ์ต์ SSD ๋ฐ RDMA ๋คํธ์ํฌ๋ฅผ ํ์ฉํ์ฌ ๊ณต์ ์คํ ๋ฆฌ์ง ๊ณ์ธต์ ์ ๊ณตํ๊ณ , ๋ถ์ฐ ์ ํ๋ฆฌ์ผ์ด์ ๊ฐ๋ฐ์ ๋จ์ํํจ
- DeepSeek V3/R1์์ ์ฌ์ฉํ๋ ์ ๋ต ๋ฐ ์ฝ๋๋ค
- DualPipe : ๊ณ์ฐ-ํต์ ์ค๋ฒ๋ฉ์ ์ํ ์๋ฐฉํฅ ํ์ดํ๋ผ์ธ ๋ณ๋ ฌํ ์๊ณ ๋ฆฌ๋ฌ
- EPLB: Expert-Parallel ๋ก๋๋ฐธ๋ฐ์
- Profile-Data: DeepSeek ์ธํ๋ผ์ ๋ฐ์ดํฐ ํ๋กํ์ผ๋ง์ผ๋ก ๊ณ์ฐ-ํต์ ์ค๋ฒ๋ฉ์ ๋ถ์
DeepSeek, DeepGEMM ์คํ์์ค ๊ณต๊ฐ (3 of 5) (github.com/deepseek-ai)|๐|
- https://news.hada.io/topic?id=19444 3P by xguru 2์ผ์ | โ favorite
- FP8 ํ๋ ฌ ๊ณฑ์ (GEMM) ์ ํจ์จ์ ์ผ๋ก ์ํํ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, DeepSeek-V3์์ ์ ์๋ ๋ฏธ์ธ ์กฐ์ ์ค์ผ์ผ๋ง(fine-grained scaling) ๋ฐฉ์์ ์ง์ํจ ์ผ๋ฐ GEMM๊ณผ Mix-of-Experts(MoE) ๊ทธ๋ฃนํ GEMM์ ๋ชจ๋ ์ง์ CUDA ๊ธฐ๋ฐ์ผ๋ก ๊ตฌํ๋์์ผ๋ฉฐ, ์ค์น ์ ๋ณ๋ ์ปดํ์ผ ์์ด ๊ฒฝ๋ Just-In-Time(JIT) ๋ชจ๋์ ์ฌ์ฉํ์ฌ ๋ฐํ์์์ ์ปค๋์ ์ปดํ์ผํจ ํ์ฌ NVIDIA Hopper ํ ์ ์ฝ์ด ์ ์ฉ์ผ๋ก ์ง์ FP8 ํ ์ ์ฝ์ด์ ๋ถ์ ํํ ๋์ ์ฐ์ฐ์ ๋ณด์ํ๊ธฐ ์ํด CUDA ์ฝ์ด ๊ธฐ๋ฐ ์ด์ค ๋์ (promotion) ์ฌ์ฉ CUTLASS ๋ฐ CuTe์ ์ผ๋ถ ๊ฐ๋ ์ ํ์ฉํ์ง๋ง, ๋ณต์กํ ํ ํ๋ฆฟ ์์กด์ฑ์ ์ค์ฌ ์ฝ 300์ค์ ์ปค๋ ์ฝ๋๋ง ํฌํจํ๋ ๋จ์ํ ์ค๊ณ Hopper FP8 ํ๋ ฌ ์ฐ์ฐ ๋ฐ ์ต์ ํ ๊ธฐ๋ฒ์ ํ์ตํ๊ธฐ์ ์ ํฉ ๊ฒฝ๋ ์ค๊ณ์๋ ๋ถ๊ตฌํ๊ณ ๋ค์ํ ํ๋ ฌ ํฌ๊ธฐ์์ ์ ๋ฌธ๊ฐ ์์ค์ผ๋ก ํ๋๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ์ ์ฌํ๊ฑฐ๋ ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์
DeepSeek, DeepEP ์คํ์์ค ๊ณต๊ฐ (2 of 5) (github.com/deepseek-ai)|๐|
- https://news.hada.io/topic?id=19421 3P by xguru 3์ผ์ | โ favorite | ๋๊ธ๊ณผ ํ ๋ก
- Mixture-of-Experts(MoE) ๋ฐ Expert Parallelism(EP)์ ์ํ ๊ณ ์ฑ๋ฅ ํต์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ GPU ๊ธฐ๋ฐ All-to-All ์ปค๋์ ์ ๊ณตํ์ฌ MoE ๋์คํจ์น ๋ฐ ๊ฒฐํฉ ์ฐ์ฐ์ ๊ณ ์์ผ๋ก ์ฒ๋ฆฌ FP8๊ณผ ๊ฐ์ ์ ์ ๋ฐ ์ฐ์ฐ ์ง์ DeepSeek-V3 ๋ ผ๋ฌธ์์ ์ ์ํ ๊ทธ๋ฃน ์ ํ ๊ฒ์ดํ (group-limited gating) ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ์ฌ ๋น๋์นญ ๋๋ฉ์ธ ๋์ญํญ ํฌ์๋ฉ์ ์ต์ ํ ์: NVLink โ RDMA ๋ฐ์ดํฐ ์ ์ก ์ต์ ํ ํ๋ จ ๋ฐ ์ถ๋ก ํ๋ฆฌํ๋ง(prefilling) ์์ ์ ์ ํฉํ ๋์ ์ฒ๋ฆฌ๋ ์ ๊ณต ์ง์ฐ์๊ฐ์ ๋ฏผ๊ฐํ ์ถ๋ก ๋์ฝ๋ฉ์ ์ํด RDMA ์ ์ฉ ์ ์ง์ฐ ์ปค๋ ํฌํจ ํต์ -์ฐ์ฐ ์ค๋ฒ๋ฉ ๊ธฐ๋ฒ ์ ๊ณต (SM ๋ฆฌ์์ค๋ฅผ ์ ์ ํ์ง ์์)
- https://news.hada.io/topic?id=19401 5P by xguru 4์ผ์ | โ favorite | ๋๊ธ 2๊ฐ
- Hopper GPU๋ฅผ ์ํ ํจ์จ์ ์ธ MLA ๋์ฝ๋ฉ ์ปค๋ ๊ฐ๋ณ ๊ธธ์ด ์ํ์ค ์๋น์ ์ํด ์ต์ ํ ๋จ ํ์ฌ ๋ฆด๋ฆฌ์ฆ ๋ ๊ฒ BF16 64 ๋ธ๋ก์ฌ์ด์ฆ Paged kvcache ๋ฒค์น๋งํฌ: CUDA 12.6์ ์ฌ์ฉํ์ฌ H800 SXM5์์ ๋ฉ๋ชจ๋ฆฌ ๋ฐ์ด๋ ๊ตฌ์ฑ์์ ์ต๋ 3000GB/s, ์ฐ์ฐ ๋ฐ์ด๋ ๊ตฌ์ฑ์์ 580 TFLOPS๋ฅผ ๋ฌ์ฑ FlashAttention 2&3 ์ cutlass ์์ ์๊ฐ์ ๋ฐ์ DeepSeek Open Infra ๋ก ๊ณต๊ฐ๋๋ 5๊ฐ ์คํ์์ค ์ค ์ฒซ๋ฒ์งธ ์
- https://github.com/deepseek-ai/FlashMLA
(250203)๋จธ์ ๋ฌ๋ ๋ชจ๋ ๋ชจ๋ธ ์ค๋ช ๐ ๊ตฟ|๐|
-
All Machine Learning Models Clearly Explained! | AI For Beginners
-
Transformers (how LLMs work) explained visually | DL5 | 3Blue1Brown
huggingface.co ๋ชจ๋ธ ๋ค์ด ๋ฐ๋ ๋ฐฉ๋ฒ|๐|
pip3 install huggingface-hub
huggingface-cli download TheBloke/LLaMA-13b-GGUF llama-13b.Q4_K_M.gguf --local-dir . --local-dir-use-symlinks False
(241217)๋๋์ด ์ฌ๋ผ์ด ์ด๊ฑธ ๋ฌ์คํธ ์ฝ๋๋ก ๋ง๋ค๋ฉด ๋๋ฐ์ด์ ใ ใ **GNโบ: C++์ CUDA๋ฅผ ์ฌ์ฉํ์ฌ ์ฒ์๋ถํฐ LLM ์ถ๋ก ์์ง ๋ง๋ค๊ธฐ**|๐|
- https://andrewkchan.dev/posts/yalm.html
- https://github.com/andrewkchan/yalm
- ์ฌ๊ธฐ์ forkํด์ ๋ง๋ฌ https://github.com/zeux/calm
- C++์ CUDA๋ฅผ ์ฌ์ฉํ์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์์ด LLM ์ถ๋ก ์์ง์ ๊ตฌ์ถํ๋ ๋ฐฉ๋ฒ
- ์ด๋ฅผ ํตํด LLM ์ถ๋ก ์ ์ ์ฒด ์คํ์ ์ดํดํ๊ณ , ๋ค์ํ ์ต์ ํ๊ฐ ์ถ๋ก ์๋์ ๋ฏธ์น๋ ์ํฅ์ ์ค๊ฐํ ์ ์์
- ๋ชฉํ : ๋จ์ผ CPU + GPU ์๋ฒ์์ ๋จ์ผ ๋ฐฐ์น๋ก ๋น ๋ฅด๊ฒ ์ถ๋ก ํ ์ ์๋๋ก ๋ชจ๋ธ์ ๊ตฌํํ๊ณ llama.cpp๋ณด๋ค ๋น ๋ฅธ ํ ํฐ ์ฒ...
- https://github.com/andrewkchan/yalm
Run LLaMA inference on CPU, with Rust ๐ฆ๐๐ฆ|๐|
-
https://github.com/rustformers/llama-rs
- ์ด๊ฒ ๋ง๋์ฃผ์? https://github.com/rustformers/llm
-
Inference Llama 2 in one file of pure Rust ๐ฆ
Fast ML inference & training for ONNX models in Rust(์ปดํจํฐ ๋น์ ผ ์ฐพ๋ค๊ฐ ์๊ฒ ๋จyolo)|๐|
-
Fast ML inference & training for ONNX models in Rust
- Rust bindings for ONNX Runtime
-
๊ฐ์ด๋๋ถ ort is an open-source Rust binding for ONNX Runtime.
Artificial_Intelligence(NLP, Natural Language Processing models and pipelines.)|๐|
-
- Burn is a new comprehensive dynamic Deep Learning Framework built using Rust with extreme flexibility, compute efficiency and portability as its primary goals.
- https://crates.io/crates/burn-candle
- https://github.com/tracel-ai/burn/tree/main/crates/burn-candle
- burn https://github.com/tracel-ai/burn
-
-
Rust native ready-to-use NLP pipelines and transformer-based models (BERT, DistilBERT, GPT2,...)
-
Rust MachineLearning
|๐|
-
-
A Rust machine learning framework.
-
-
-
ndarray: an N-dimensional array with array views, multidimensional slicing, and efficient operations
-
dfdx: shape checked deep learning in rust|๐|
-
https://github.com/coreylowman/dfdx
-
dfdx v0.11.0: ergonomic GPU accelerated deep learning ENTIRELY in rust!
-
Minimalist ML framework for Rust|๐|
https://github.com/huggingface/candle
ollama ์ธ๋งํ๊ฑฐ|๐|
# llama3.3(๊ฐ์ ์ฉ ์ปดํจํฐ๋ก 405B๋ชจ๋ธ์ ๊ฒฝํ ๊ฐ๋ฅ ์ง๊ธ์ ์์ฃผ ๋๋ฆฌ๋ค. 241212
# New state of the art 70B model. Llama 3.3 70B offers similar performance compared to Llama 3.1 405B model.
ollama run llama3.3
# ollam ํ๋ก์ธ์ ์ ์คํ ๋๋์ง ํ์ธ
# pgrep ollama
6327
6521
# ollam "/bye" ๋ก ์ข
๋ฃ ์ํค๊ณ ์๋น์ค ์ข
๋ฃ ์ํค๊ธฐ
$ systemctl stop ollama.service
# 4.7GB
ollama run llama3.1
# 26GB
ollama run mixtral:8x7b
# 39GB
ollama run llama3.1:70b
# 79GB
ollama run mixtral:8x22b
(C++์ฝ๋๋ก ๋จธ์ ๋ฌ๋ ์ ์ค๋ช ๋จ.)Snake learns with NEUROEVOLUTION (implementing NEAT from scratch in C++) |Tech With Nikola|๐|
- https://youtu.be/lAjcH-hCusg?si=eeEWJpy3SacoQYAb
- ์ญ์ ํต์ฌ์ Sigmoid ํจ์์ Bias๋ฅผ ํ์ฉํ๋๊ฒ!
1bit์ ์ง์คํ์ NVIDIA๋ ์ด์ ๋์ด๋ค|๐|
- Will NVIDIA Survive The Era of 1-Bit LLMs? | Finxter
- Matrix Multiplication is AI - What 1.58b LLMs Mean for NVIDIA | Finxter
Blackwell | Hopper | |
---|---|---|
Supported Tensor Core precisions | FP64, TF32, BF16, FP16, FP8, INT8, FP6, FP4 | FP64, TF32, BF16, FP16, FP8, INT8 |
Supported CUDA* Core precisions | FP64, FP32, FP16, BF16 | FP64, FP32, FP16, BF16, INT8 |
- Nvidia Blackwell Deep Dive (GB 200 NVL72) $125B Revenue Projection
Microsoft, CPU์์ ์คํ๊ฐ๋ฅํ ์ด๊ณ ํจ์จ AI ๋ชจ๋ธ BitNet ๊ฐ๋ฐ|๐|
- Microsoft ์ฐ๊ตฌ์ง์ด BitNet b1.58 2B4T๋ผ๋ ์ดํจ์จ์ ์ธ AI ๋ชจ๋ธ์ ๊ฐ๋ฐํ์
- 1๋นํธ ์์ํ๋ฅผ ํตํด ๋์ ์๋์ ๋ฎ์ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋ ๋ฌ์ฑํ์ฌ CPU์์๋ ์คํ ๊ฐ๋ฅํ๋ฉฐ MIT ๋ผ์ด์ ์ค๋ก ๊ณต๊ฐ๋จ
- Applโฆ
- https://news.hada.io/topic?id=20406
NVIDIA์นฉ ์์ธํ ์์๋ณด๊ธฐ(240617)|๐|
NVIDIA๋ 16-bit Float(FP16/BF16) ๋ถ๋ ์์์ ์ ์ต์ ํ ๋์ด์์ด์|๐|
- ์์ ํ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๊ณ ์๋ค.
- Develop optimized kernels for 1-bit operations
- Use FPGAs or ASICs for 1-bit operations
BitNet b1.58(This Work). vs 16-bit Float(FP16/BF16)|๐|
- 9min 46s ์ฐธ๊ณ
Why BitNet b1.58?|๐|
- Each cell only three values:
- { -1, 0 ,1 }
- How many bits are needed to differentiate three equally likely states?
(24๋ 04์๊ฒฝ์ฏค)GNโบ: 1๋นํธ LLM ์๋: ๋น์ฉ ํจ์จ์ ์ธ ์ปดํจํ ์ ์ํ ์ผ์ง ํ๋ผ๋ฏธํฐ (arxiv.org)|๐|
๋ฒกํฐ DB์ ๊ฐ๋ ์ก๊ธฐ & LLM์ ์ ์|๐|
-
์ถ์ฒ : http://www.itdaily.kr/news/articleView.html?idxno=220008
-
LLM์
- ๋ฅ๋ฌ๋์ ํ ์ข ๋ฅ๋ก ๋ฒกํฐ ๋ฐ์ดํฐ๋ก ์ด๋ฃจ์ด์ง ์ธ์ด๋ชจ๋ธ์ด๋ผ๋ ๊ฒ์ด๋ค. ์ค์ ๋ฒกํฐ ๋ฐ์ดํฐ๋ก ์ด๋ค์ง LLM์๋ ์ด๋ฏธ ๋ฐ์ดํฐ๋ค์ ์ ์ฅํ๋ ๋ฒกํฐ DB๊ฐ ๋ด์ฅ๋ผ ์๋ค.
-
๋ฒกํฐ DB๋
- ์ ์ฌํ ๋ฒกํฐ๊ฐ๋ผ๋ฆฌ ๊ตฐ์ง์ ํ์ฑํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ์ต์ํค๊ธฐ ์ํด์ ๋ฒกํฐ ๋ฐ์ดํฐ์ ํนํ๋ ๋ฐ์ดํฐ ์ ์ฅ์๊ฐ ํ์ํ๋ค. ์ด๋ฌํ ์๊ตฌ์ ๋ฐ๋ผ ์ ํํ๋ ๋ฐ์ดํฐ๊ฐ ์๋ ๋น์ ํ ๋ฐ์ดํฐ๋ฅผ ๋น ๋ฅด๊ฒ ๋ฒกํฐํ(์๋ฒ ๋ฉ, Embedding)ํด ์ ์ฅํ๊ณ ์ฝ์ ์ ์๋ ๋ฒกํฐ DB๊ฐ ๋ฑ์ฅํ๋ค.
-
๋ฒกํฐDB์ ์ฅ์ 4๊ฐ์ง
- โณ๋ฒกํฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ
- โณ๋ฒกํฐ ๊ฒ์ ๋ฐ ์ ์ฌ์ฑ ๋ถ์
- โณ๋์ฉ๋ ๋ฒกํฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ
- โณ๋ฒกํฐ ๋ฐ์ดํฐ ๊ฐฑ์ ๋ฑ์ ํนํ๋ ์ฅ์ ์ ๊ฐ๊ณ ์๋ค.
-
- โณ๋ฒกํฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ
- ๋ฒกํฐ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐ ํนํ๋ผ ์๋ค. ์์ฑํ AI์์๋ ์ฃผ๋ก ๋ฒกํฐ ๋ฐ์ดํฐ๊ฐ ์ด์ฉ๋๋ค. LLM ๋ด ํ ํฐ์ด ๋ฒกํฐํ๋ผ ๋ด์ฅ๋ ๋ฒกํฐ DB์ ์ ์ฅ๋ผ ์๊ธฐ ๋๋ฌธ์ด๋ค. ์์ฑํ AI์์๋ ์ฃผ๋ก ์ด๋ฏธ์ง, ์์ฑ, ํ ์คํธ ๋ฑ ๋น์ ํ ๋ฐ์ดํฐ๊ฐ ๋ฒกํฐ ํํ๋ก ๋ณํ๋ผ ์ฒ๋ฆฌ๋๋๋ฐ, ๋ฒกํฐ DB๋ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ ์ฅํ๊ณ ๊ด๋ฆฌํ ์ ์๋ค.
-
- โณ๋ฒกํฐ ๊ฒ์ ๋ฐ ์ ์ฌ์ฑ ๋ถ์
- ๋ฒกํฐ ๊ฒ์ ๋ฐ ์ ์ฌ์ฑ ๋ถ์์ ํนํ๋ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ค๋ ์ ์ด๋ค. ์ด์ ๋ํด EDB ์ธก ๊ด๊ณ์๋ โ์์ฑํ AI์์๋ ๋ฒกํฐ ๋ฐ์ดํฐ ๊ฐ์ ์ ์ฌ์ฑ์ ๋ถ์ํ๊ฑฐ๋ ๋ฒกํฐ ๋ฐ์ดํฐ ๊ฒ์์ด ํ์ํ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ๋ฒกํฐ DB๋ ์ด๋ฌํ ์๊ตฌ์ฌํญ์ ํนํ๋ ๊ธฐ๋ฅ์ ์ ๊ณตํด ๋ฒกํฐ ๋ฐ์ดํฐ ๊ฐ ์ ์ฌ์ฑ์ ํจ๊ณผ์ ์ผ๋ก ๊ณ์ฐํ๊ณ ๊ฒ์ํ ์ ์๋ค. ๋ฐ๋ผ์ ์์ฑํ AI์์๋ ๋ฒกํฐ DB๋ฅผ ํตํด ๋น ๋ฅด๊ณ ์ ํํ ๋ฒกํฐ ๊ฒ์ ๋ฐ ์ ์ฌ์ฑ ๋ถ์์ด ๊ฐ๋ฅํ๋คโ๊ณ ์ค๋ช ํ๋ค.
-
- โณ๋์ฉ๋ ๋ฒกํฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ
- ์ธ ๋ฒ์งธ๋ก๋ ๋์ฉ๋ ๋ฒกํฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํ๋ค๋ ์ ์ด๋ค. ์์ฑํ AI ๋ชจ๋ธ์ ๋์ฉ๋์ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃฌ๋ค. ๋ฒกํฐ DB๋ ๋์ฉ๋์ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ ์ฅํ๊ณ ์ฒ๋ฆฌํ ์ ์๋ ๊ธฐ๋ฅ์ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์ ์์ฑํ AI ๋ชจ๋ธ์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ๋์ํ ์ ์๋ค. ๋๋ฆฌ ์ฐ์ด๋ ๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค(RDB)๋ ๋ฒกํฐ ๋ฐ์ดํฐ์ ๊ธธ์ด๋ ํํ์ ๋ค์์ฑ, ์ฟผ๋ฆฌ ๋ฐ ์ธ๋ฑ์ฑ, ๋ฐ์ดํฐ ๋ชจ๋ธ ๋ฌด๊ฒฐ์ฑ ์ ์ฝ ๋ฑ ๋๋ฌธ์ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๊ธฐ์ ์ ํฉํ์ง ์๋ค.
-
- โณ๋ฒกํฐ ๋ฐ์ดํฐ ๊ฐฑ์
- ๋ฒกํฐ DB๋ ๋ฒกํฐ ๋ฐ์ดํฐ์ ๊ฐฑ์ ๋ฐ ์ฟผ๋ฆฌ์ ๋ํ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ค. ๋ฒกํฐ DB๋ ์ผ๋ฐ์ ์ผ๋ก ๋จ๋
์ผ๋ก ์ฐ์ด์ง ์๋๋ค. ๋๋ถ๋ถ์ ๊ฒฝ์ฐ LLM์ ๋ฒกํฐ DB๊ฐ ์ฐ๊ฒฐ๋ ๋ญ์ฒด์ธ(LangChain)์ด๋ผ๋ ์ธ์ด ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ์ ์ฅํ๋ ํ๋ซํผ์ ์ฐ๊ฒฐํด ์ด์ฉํ๋ ๊ตฌ์กฐ๋ค. ๋ฐ์ดํฐ ์์ค. ๋จ์ด ์๋ฒ ๋ฉ, ๋ฒกํฐ DB ๋ฑ์ LLM๊ณผ ์ฐ๊ฒฐํ๋ ๋งค๊ฐ๋ผ๊ณ ๋ณผ ์ ์๋ค. ๊ฐ๋ณ๋ก ๊ตฌ์ถ๋ ๋ฒกํฐ DB์ ์ต์ ์ ๋ฐ์ดํฐ๋ฅผ ์๋ฒ ๋ฉํด ์ ์ฅํ๋ฉด LLM ์ฌํ์ต ํ์ง ์๊ณ ๋ ์ต์ ๋ฐ์ดํฐ๋ฅผ LLM์ ์ ์ฉํ ์ ์๊ฒ ๋๋ค.
- โ์์ฑํ AI์ ์น๋ช ์ ์ธ ๋ฌธ์ ๋ก ๊ผฝํ๋ ํ๊ฐ ํ์์ ์๋น ๋ถ๋ถ ๋ฐ์ดํฐ ์ต์ ํ ๋ฌธ์ ๋๋ฌธ์ ๋ฐ์ํ๋ค. LLM์ ํน์ ์์ ๊น์ง ํ์ต๋ ๋ฐ์ดํฐ๋ก ๊ตฌ์ถ๋๋ค. ๋๋ฌธ์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๊พธ์คํ ์ต์ ํํด์ผ ํ๋ค. ๊ทธ๋ฌ๋ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ต์ ํ ํ๊ธฐ ์ํด์๋ ์ธํ๋ผ ๋น์ฉ, GPU ๋น์ฉ, ์ธ๋ ฅ ํฌ์ ๋ฑ ๋ง์ ๋น์ฉ๊ณผ ์๊ฐ์ด ํ์ํ๋ค. ์ด๋ฐ ๋ฌธ์ ์ ์๋น๋ถ๋ถ์ ๋ฒกํฐ DB๋ก ํด๊ฒฐํ ์ ์๋คโ
-
๋ฒกํฐDB์ ์ฐจ์ด์
- ๋ฒกํฐ DB๋ ์ฌ์ค ํ DBMS์ ํฐ ์ฐจ์ด๊ฐ ์๋ค. ๋ค๋ง ๋ค๋ฃจ๋ ๋ฐ์ดํฐ์ ์ฑ๊ฒฉ๊ณผ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ์ด ๋ค๋ฅด๋ค. ๋ฒกํฐ DB๋ ์ฃผ๋ก ์ค์(Real Number) ํํ์ ๋ฐ์ดํฐ๊ฐ ํฌํจ๋๋ค. ๋ ์ค์ ํํ์ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ ์ฌ๋๊ฐ ๋์ ๊ฒฐ๊ณผ๋ฅผ ์ถ์ถํ๊ธฐ ์ํด ๋ค์ํ ๋ฐฉ๋ฒ์ ์ ๊ณตํ ์ ์๋คโ๋ฉด์ โ๋ฒกํฐํ๋ ๋ฐ์ดํฐ ๊ฐ์ ์ ์ฌ๋๋ฅผ ์ธก์ ํ๋ ๋ฐ์๋ ์ฃผ๋ก โ์ฝ์ฌ์ธ ์ ์ฌ๋(Cosine Similarity)โ์ โ์ ํฌ๋ฆฌ๋ ๊ฑฐ๋ฆฌ(Euclidean Distance)โ ๋ฑ์ ์ธก์ ๋ฐฉ๋ฒ์ด ํ์ฉ๋๋ค. ์ฝ์ฌ์ธ ์ ์ฌ๋๋ ๋ ๋ฒกํฐ ์ฌ์๊ฐ์ ํตํด ๋ฒกํฐ ๋ฐ์ดํฐ๊ฐ ์ผ๋ง๋ ์ ์ฌ๋๊ฐ ์๋์ง ์ธก์ ํ๋ ๋ฐฉ๋ฒ์ด๋ฉฐ, ์ ํฌ๋ฆฌ๋ ๊ฑฐ๋ฆฌ๋ ํ๋ฉด์์์ ๋ ๋ฒกํฐ๊ฐ ์ฌ์ด์ ์ง์ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ ํด ๊ฐ ์ฌ์ด์ ์ ์ฌ๋๋ฅผ ํ์ ํ๋ ๋ฐฉ๋ฒ์ด๋คโ๋ผ๊ณ ์ค๋ช ํ๋ค.
- โ๋ฒกํฐ DB๋ ์๋ฏธ ๊ธฐ๋ฐ์ ์ฟผ๋ฆฌ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ค. ๊ธฐ์กด DBMS๋ ๊ฐ ์คํค๋ง์ ๊ด๊ณ๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ถ์ถํ๋ ๋ฐ ์ค์ ์ ๋์ง๋ง, ๋ฒกํฐ DB๋ ์์นํ๋ ๋ฒกํฐ์ ์๋ฏธ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ถ์ถํ๋ ๋ฐ ์ค์ ์ ๋๋ค. ์์นํ๋ ๋ฐ์ดํฐ ์ ์ฅ๊ณผ ์ ์ฌ๋ ์ธก์ ์ ์ํ ๋ค์ํ ์๊ณ ๋ฆฌ์ฆ์ ์ ๊ณตํ๋ DB๊ฐ ๋ฐ๋ก ๋ฒกํฐ DB๋คโ
์ด๋ณด์๋ฅผ ์ํ Vector Embeddings ๊ฐ์ด๋ (timescale.com)|๐|
-
https://news.hada.io/topic?id=15094&utm_source=weekly&utm_medium=email&utm_campaign=202423
- 26P by xguru 24.05.31.
-
๋ฒกํฐ ์๋ฒ ๋ฉ์ ์ข ๋ฅ
- ๋จ์ด ์๋ฒ ๋ฉ: NLP์์ ๋จ์ด๋ฅผ ํํํ๋ฉฐ, ๋จ์ด ๊ฐ์ ์๋ฏธ์ ๊ด๊ณ๋ฅผ ์บก์ฒํจ. ์ธ์ด ๋ฒ์ญ, ๋จ์ด ์ ์ฌ์ฑ, ๊ฐ์ ๋ถ์ ๋ฑ์ ์ฌ์ฉ๋จ.
- ๋ฌธ์ฅ ์๋ฒ ๋ฉ: ๋ฌธ์ฅ์ ์๋ฏธ์ ๋ฌธ๋งฅ์ ์บก์ฒํ๋ฉฐ, ์ ๋ณด ๊ฒ์, ํ ์คํธ ๋ถ๋ฅ, ๊ฐ์ ๋ถ์ ๋ฑ์ ์ฌ์ฉ๋จ.
- ๋ฌธ์ ์๋ฒ ๋ฉ: ๋ณด๊ณ ์๋ ๊ธฐ์ฌ ๊ฐ์ ๋ฌธ์์ ๋ด์ฉ์ ์บก์ฒํ๋ฉฐ, ์ถ์ฒ ์์คํ , ์ ๋ณด ๊ฒ์, ๋ฌธ์ ์ ์ฌ์ฑ ๋ฐ ๋ถ๋ฅ ๋ฑ์ ์ฌ์ฉ๋จ.
- ๊ทธ๋ํ ์๋ฒ ๋ฉ: ๊ทธ๋ํ์ ๋ ธ๋์ ์ฃ์ง๋ฅผ ๋ฒกํฐ ๊ณต๊ฐ์ ํํํ๋ฉฐ, ๋ ธ๋ ๋ถ๋ฅ, ์ปค๋ฎค๋ํฐ ์ธ์, ๋งํฌ ์์ธก ๋ฑ์ ์ฌ์ฉ๋จ.
- ์ด๋ฏธ์ง ์๋ฒ ๋ฉ: ์ด๋ฏธ์ง์ ๋ค์ํ ์ธก๋ฉด์ ํํํ๋ฉฐ, ์ฝํ ์ธ ๊ธฐ๋ฐ ์ถ์ฒ ์์คํ , ์ด๋ฏธ์ง ๋ฐ ๊ฐ์ฒด ์ธ์, ์ด๋ฏธ์ง ๊ฒ์ ์์คํ ๋ฑ์ ์ฌ์ฉ๋จ.
- ์ ํ ์๋ฒ ๋ฉ: ๋์งํธ ์ ํ์ด๋ ๋ฌผ๋ฆฌ์ ์ ํ์ ํํํ๋ฉฐ, ์ ํ ์ถ์ฒ ๋ฐ ๋ถ๋ฅ ์์คํ , ์ ํ ๊ฒ์ ๋ฑ์ ์ฌ์ฉ๋จ.
- ์ค๋์ค ์๋ฒ ๋ฉ: ์ค๋์ค ์ ํธ์ ๋ฆฌ๋ฌ, ํค, ํผ์น ๋ฑ์ ํํํ๋ฉฐ, ๊ฐ์ ๊ฐ์ง, ์์ฑ ์ธ์, ์์ ์ถ์ฒ ๋ฑ์ ์ฌ์ฉ๋จ.
-
์ ๊ฒฝ๋ง์ด ์๋ฒ ๋ฉ์ ์์ฑํ๋ ๋ฐฉ๋ฒ
- ํํ ํ์ต: ์ ๊ฒฝ๋ง์ด ๊ณ ์ฐจ์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฐจ์ ๊ณต๊ฐ์ผ๋ก ๋งคํํ์ฌ ์ค์ํ ํน์ฑ์ ๋ณด์กดํจ.
- ํ๋ จ ๊ณผ์ : ์ ๊ฒฝ๋ง์ด ๋ฐ์ดํฐ๋ฅผ ์๋ฏธ ์๋ ์๋ฒ ๋ฉ์ผ๋ก ๋ณํํ๋๋ก ํ์ตํจ. ์ด๋ ๋ด๋ฐ์ ๊ฐ์ค์น์ ๋ฐ์ด์ด์ค๋ฅผ ์กฐ์ ํ๋ ๊ณผ์ ์์ ์ด๋ฃจ์ด์ง.
- ์์: ์ํ ๋ฆฌ๋ทฐ์ ๊ธ์ /๋ถ์ ๋ถ๋ฅ๋ฅผ ์ํ ์ ๊ฒฝ๋ง์์ ๋จ์ด ์๋ฒ ๋ฉ์ด ํ์ต๋จ. "good"๊ณผ "excellent" ๊ฐ์ ๋จ์ด๋ ์ ์ฌํ ์๋ฒ ๋ฉ์ ๊ฐ์ง๊ฒ ๋จ.
-
๋ฒกํฐ ์๋ฒ ๋ฉ์ ์๋ ์๋ฆฌ
- ๋ฒกํฐ ๊ณต๊ฐ: ๊ฐ์ฒด๋ ํน์ง์ ๋ค์ฐจ์ ๋ฒกํฐ ๊ณต๊ฐ์ ์ ์ผ๋ก ํํํ๋ฉฐ, ์ ์ฌํ ํญ๋ชฉ์ ๊ฐ๊น์ด ์์นํจ.
- ๊ฑฐ๋ฆฌ ์ธก์ : ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ, ์ฝ์ฌ์ธ ์ ์ฌ๋ ๋ฑ์ ์ฌ์ฉํ์ฌ ๋ฒกํฐ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ ๋ํํจ.
- ์์: "cat"๊ณผ "dog"์ ๋ฒกํฐ๋ "cat"๊ณผ "car"์ ๋ฒกํฐ๋ณด๋ค ๋ ๊ฐ๊น์ด ์์นํจ.
-
๋ฒกํฐ ์๋ฒ ๋ฉ์ ํ์ฉํ ๊ฐ๋ฐ
- ์ฑ๋ด: ์ฌ์ฉ์ ์ฟผ๋ฆฌ์ ๋ ์ ์๋ตํ๊ณ , ๋ฌธ๋งฅ์ ์ผ๋ก ๊ด๋ จ๋ ์๋ต์ ์์ฑํ๋ฉฐ, ์ผ๊ด๋ ๋ํ๋ฅผ ์ ์งํจ.
- ์๋งจํฑ ๊ฒ์ ์์ง: ํค์๋ ๋งค์นญ ๋์ ์๋ฏธ์ ์ ์ฌ์ฑ์ ๊ธฐ๋ฐํ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํจ.
- ํ ์คํธ ๋ถ๋ฅ ์์คํ : ๋ฌธ์๋ฅผ ๊ตฌ๋ฌธ๊ณผ ๋จ์ด์ ๋ฐ๋ผ ๋ถ๋ฅํจ.
- ์ถ์ฒ ์์คํ : ํค์๋์ ์ค๋ช ์ ์ ์ฌ์ฑ์ ๋ฐ๋ผ ์ฝํ ์ธ ๋ฅผ ์ถ์ฒํจ.
-
๋ฐ์ดํฐ์ ๋ํ ๋ฒกํฐ ์๋ฒ ๋ฉ ์์ฑ ๋ฐฉ๋ฒ
- ๋ฐ์ดํฐ ์์ง: ํ ์คํธ, ์ค๋์ค, ์ด๋ฏธ์ง, ์๊ณ์ด ๋ฐ์ดํฐ ๋ฑ ๋ค์ํ ๋ฐ์ดํฐ๋ฅผ ์์งํจ.
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ: ํ ํฐํ, ๋ ธ์ด์ฆ ์ ๊ฑฐ, ์ด๋ฏธ์ง ํฌ๊ธฐ ์กฐ์ , ์ ๊ทํ ๋ฑ ๋ฐ์ดํฐ๋ฅผ ๋ถ์์ ์ ํฉํ๊ฒ ์ฒ๋ฆฌํจ.
- ๋ฐ์ดํฐ ๋ถํ : ํ ์คํธ๋ฅผ ๋ฌธ์ฅ์ด๋ ๋จ์ด๋ก, ์ด๋ฏธ์ง๋ฅผ ์ธ๊ทธ๋จผํธ๋ก, ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ฒฉ์ผ๋ก ๋๋.
- ๋ฒกํฐํ: ๊ฐ ๋ฐ์ดํฐ ์กฐ๊ฐ์ ๋ฒกํฐ๋ก ๋ณํํจ. ํ ์คํธ ๋ฐ์ดํฐ๋ OpenAI์ ํ ์คํธ ์๋ฒ ๋ฉ ๋ชจ๋ธ, ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ CNN ๋ชจ๋ธ, ์ค๋์ค ๋ฐ์ดํฐ๋ ์คํํธ๋ก๊ทธ๋จ ๋ฑ์ ์ฌ์ฉํจ.
-
๋ฒกํฐ ์๋ฒ ๋ฉ ์ ์ฅ ๋ฐฉ๋ฒ
- ๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค: ๋ฒกํฐ ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ ์ฅํ๊ณ ๊ฒ์ํ ์ ์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ฌ์ฉ.
- PostgreSQL: ๋ฒกํฐ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฅธ ๊ด๊ณํ ๋ฐ์ดํฐ์ ํจ๊ป ์ ์ฅํ ์ ์์. pgvector ํ์ฅ์ ์ฌ์ฉํ์ฌ ๋ฒกํฐ๋ฅผ ์ ์ฅํ๊ณ ์ฟผ๋ฆฌํ ์ ์์.
-
๊ทธ ์ธ์ ์ข์๊ธ
์ญ์ ๊ฐ c์ธ์ด|๐|
- llm.c, ์ด์ ๋ฉํฐGPU ํธ๋ ์ด๋์ ์ง์ํ๋ฉฐ PyTorch๋ณด๋ค ~7% ๋น ๋ฆ
- Andrej Karpathy๊ฐ ์์ C/CUDA๋ก ๋ง๋ ๊ฐ๋จํ LLM ํ๋ จ ์ฝ๋
- ์ด์ ๋ฉํฐ GPU ํธ๋ ์ด๋์ bfloat16์ผ๋ก Flash Attention๊ณผ ํจ๊ป ์ํ
- ~3000 ๋ผ์ธ์ C/CUDA ์ฝ๋๋ก ๊ตฌํ๋์์ผ๋ฉฐ, ์ ๋ฐ์ ์ผ๋ก PyTorch๋ณด๋ค 7% ์ ๋๊น์ง ๋น ๋ฆ
- ์ง๊ธ๊น์ง ์์
ํ ๋ด์ฉ๋ค
- ํผํฉ ์ ๋ฐ๋ ํ๋ จ(bfloat16)
- ์ ๊ทํ๋...
ํ์ดํ ์น bye bye ๐ ์กด๋๊ฒ ๊ตฌ๋ฆฐ ํ์ดํ ์น ใ ใ ใ ๊ทธ๋์ ์ฐธ๊ณ ์ฐ๋๋ผ ํ๋ค์๋ค ใ ใ ๋๋ฝ๊ณ ์น์ฌํด์ ๋ ๊ณต๋ถํด์ ๋ฌ์คํธ๋ก ๋ง๋ค์ด ๋ณด์ ใ ใ |๐|
๋ฐ๋ก ํด๋ด์ผ์ง|๐|
MachineLearning_Tutorial|๐|
-
Introduction to Deep Learning
-
Lecture notes on Bayesian deep learning
-
ํ์ดํ ์น ๊ตฌ๋ฆฌ์ง๋ง ์์ง ๊ธฐ๋๊ถ์ด๋ ๊ณต๋ถํ์( PyTorch for Deep Learning & Machine Learning โ Full Course | freeCodeCamp.org
LLM -> LMM์ผ๋ก ํจ๋ฌ๋ค์ ์ ํ ์ค~~|๐|
- 231012_LLM์ ์๋ง...์ด๋ฏธ์ง๊น์ง ํ์ตํ 'LMM' ๋ฌ๋ค
- https://www.aitimes.com/news/articleView.html?idxno=154291
- ๋ํ์ธ์ด๋ชจ๋ธ(LLM)'์ ์ด์ด ์์ผ๋ก๋ '๋ํ๋ฉํฐ๋ชจ๋ฌ๋ชจ๋ธ(LMM)
- LLM(Large Language Models)
- Multimodality and Large Multimodal Models (LMMs)
- 231014_๋ชจ๋ DB๋ ๋จธ์ง์์ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค๊ฐ ๋ ๊ฒ์ด๋ค (nextword.substack.com)
- 231014_Llama 2 Everywhere (L2E) - ์คํ ๋์ผ๋ก , ๋ฐ์ด๋๋ฆฌ ํฌํฐ๋ธ, ๋ถํ ๊ฐ๋ฅํ Llama 2 (github.com/trholding)
Jupyter ๋ ธํธ๋ถ ๋ฌ์คํธ๋ก ๋น ๋ฅด๊ฒ ๋๋ฆฌ๊ธฐ|๐|
-
First, you need to download and build the kernel itself via cargo:
$ cargo install --locked evcxr_jupyter
- Then, use its binary to automatically install it inside Jupyter:
$ evcxr_jupyter --install
Rust+WASM์ผ๋ก ์ด๊ธฐ์ข Edge์์ ๋น ๋ฅด๊ณ ํฌํฐ๋ธํ Llama2 ์ถ๋ก ์คํํ๊ธฐ (secondstate.io)|๐|
https://pytorch.org/get-started/locally/
h2oGPT - ์์ ํ ์คํ์์ค GPT (github.com/h2oai)|๐|
-
https://github.com/h2oai/h2ogpt
- ํ๊ธ๋ก ๋ ๋ด์ค ๊ธฐ์ฌโ๋ ธํธ๋ถ์ผ๋ก๋ ๋๋ฑโยทยทยท ๋ก์ปฌ ์์คํ ์ฉ LLM ๋๊ตฌ 5์ข ๋ฐ๋ผ์ก๊ธฐ https://www.ciokorea.com/news/305929?page=0,0
-
๋ ธํธ๋ถ์ผ๋ก๋ ๋๋ฑโยทยทยท ๋ก์ปฌ ์์คํ ์ฉ LLM ๋๊ตฌ 5์ข ๋ฐ๋ผ์ก๊ธฐ (์๋ฌธ๋ณด๊ธฐ:https://www.ciokorea.com/news/305929?page=0,0#csidx306f4ef0cca5c53bd4ca4c68ff36480 )
llama2๋ฅผ ํ์ธ ํ๋ ํ๊ณ ์๋ ์ฌ๋๋ค|๐|
JS๊ฐ์ No Black Box Machine Learning Course โ Learn Without Libraries|๐|
https://youtu.be/vDDjtwQDw2k?si=exYH6L2aHAYEqGTJ
- Machine Learning & Neural Networks without Libraries โ No Black Box Course
AlphaGo - The Movie | Full award-winning documentary|๐|
https://youtu.be/WXuK6gekU1Y?si=D9ZPN7Lxc6icN2g9
Building a neural network FROM SCRATCH (no Tensorflow/Pytorch, just numpy & math)|๐|
- C์ธ์ด๋ก Tesorflow/Pythorch ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ ์ฐ๊ณ ์ ๊ฒฝ๋ง ๊ตฌ์ถํ๊ธฐ ๊ผญ ํด๋ณด์โค
์ ๊ฒฝ๋ง ์ํ ๊ทธ๋ฆผ์ผ๋ก ๋ค ์ดํดํ๊ธฐ - ๋ณต์กํ ์ ๊ฒฝ๋ง๋ ๋ค ์ดํด๋๋ค !!! ์ต๊ณ Why Neural Networks can learn (almost) anything | Emergent Garden|๐|
Dalai - Automatically install, run, and play with LLaMA on your computer|๐|
- What is Dalai?
It lets you one-click install LLaMA on your machine. No need to bother building cpp files, cloning GitHub, and downloading files and stuff. Everything is automated. Dalai is a tool in the Large Language Model Tools category of a tech stack. Dalai is an open source tool with GitHub stars and GitHub forks. Hereโs a link to Dalai's open source repository on GitHub
https://cocktailpeanut.github.io/dalai/#/
- ํ๊ตญ์ ๋๊ตฐ๊ฐ ์ฌ๋ฆฐ ๊ฒ์ํ ๊ธ
https://www.ddengle.com/board_free/19129866
The Pile is a large, diverse, open source language modelling data set|๐|
https://github.com/EleutherAI/the-pile
brew install libtorch(macOS)|๐|
- pytorch ์คํ์ ์ด๊ฑฐ ๋จผ์ ์คํํ ๊ฒ !!!
export LIBTORCH='/opt/homebrew/Cellar/pytorch/1.13.1'
export LD_LIBRARY_PATH=$LIBTORCH:$LD_LIBRARY_PATH
echo $LD_LIBRARY_PATH
/opt/homebrew/Cellar/pytorch/1.13.1:
Rust Artificial Intelligence (The Simple Way)|๐|
https://github.com/guillaume-be/rust-bert
The AI community building the future.|๐|
How to Build a Machine Learning Model in Rust|๐|
https://www.freecodecamp.org/news/how-to-build-a-machine-learning-model-in-rust/
Rust Machine Learning Book|๐|
Unicode (Vim Plug-in)|๐|
https://github.com/chrisbra/unicode.vim
- Ex commands:
:UnicodeTable - Print Unicode Table in new window
:Digraphs - Search for specific digraph char
:UnicodeSearch - Search for specific unicode char
:UnicodeSearch! - Search for specific unicode char (and add at current cursor position)
:UnicodeName - Identify character under cursor (like ga command)
:DownloadUnicode - Download (or update) Unicode data
:UnicodeCache - Create cache file
- Normal mode commands:
<C-X><C-G> - Complete Digraph char
<C-X><C-Z> - Complete Unicode char
<F4> - Combine characters into digraphs
Scripting Functions:
unicode#FindUnicodeBy() - Find unicode characters
unicode#FindDigraphBy() - Find Digraph char
unicode#Digraph() - Returns digraph char
unicode#UnicodeName() - Identifies unicode character (by value)
Natural Language Processing for Rust|๐|
https://github.com/lexi-sh/rs-natural
This repository is a list of machine learning libraries written in Rust. It's a compilation of GitHub repositories, blogs, books, movies, discussions, papers, etc. ๐ฆ|๐|
https://github.com/vaaaaanquish/Awesome-Rust-MachineLearning
Here is an example of a simple machine learning program written in the Rust programming language:|๐|
- GPT3
This program sets up a game context and creates a new MainState struct to hold the game's state. It then runs the game loop, which handles events and updates the game state accordingly. The MainState struct and its associated methods and the event handling methods can be customized to implement the specific game logic and mechanics.
use ndarray::{Array, Array2};
use rand::{thread_rng, Rng};
use rusty_machine::linalg::{Matrix, Vector};
use rusty_machine::learning::k_means::KMeansClassifier;
use rusty_machine::learning::UnSupModel;
// Create some random data to cluster
let mut rng = thread_rng();
let data: Vec<Vector<f64>> = (0..100)
.map(|_| Vector::new(vec![rng.gen(), rng.gen()]))
.collect();
let data = Matrix::new(100, 2, data);
// Create a new k-means model with 2 clusters
let mut model = KMeansClassifier::new(2);
// Train the model on the data
model.train(&data)?;
// Predict the cluster assignments for the data
let assignments = model.predict(&data)?;
// Print the cluster assignments
println!("Cluster assignments: {:?}", assignments);
This program creates some random data and uses the KMeansClassifier type from the rusty_machine crate to train a k-means clustering model on the data. It then uses the trained model to predict the cluster assignments for the data and prints the results. The KMeansClassifier type and the train and predict methods can be customized to implement different machine learning algorithms and apply them to different types of data.
- ์๊ทผํ ์ฝ๋ ์ ๋ง๋๋ค. ใ
https://athemathmo.github.io/rusty-machine/doc/rusty_machine/index.html
How to Build a Machine Learning Model in Rust|๐|
https://www.freecodecamp.org/news/how-to-build-a-machine-learning-model-in-rust/
Machine_Learning_Rust|๐|
๋จธ์ ๋ฌ๋๊ธฐ์ด|๐|
-
Machine Learning Course for Beginners | freeCodeCamp.org
-
Understanding NVIDIA GPU Hardware as a CUDA C Programmer | Episode 2: GPU Compute Architecture | 0Mean1Sigma
-
Awesome Production Machine Learning
- This repository contains a curated list of awesome open source libraries that will help you deploy, monitor, version, scale, and secure your production machine learning ๐
- https://github.com/EthicalML/awesome-production-machine-learning
- Rust code๋ค ๋ชจ์
- ์ต์ ์ฝ๋ ๋ง์
- ์ข๊ธด ํ๋ฐ ์๋ ๊บผ...
์๋ฒ ๋ฉ๊ณผ ์ ๋ณด ๊ฒ์ ์ ๊ณผ์ โ ์๋ฒ ๋ฉ ๊ฐ๋ ๊ณผ ํ๊ณ, ๋ฐ์ดํฐ์ ์์ฑยท๋ผ๋ฒจ๋ง, ๊ฐ์ข ์คํ ๋ ์ ธํ ๋ชจ๋ธ ํ๊ฐ, ํ์ด๋ธ๋ฆฌ๋ยท๋ฆฌ๋ญํน, ์๋ฒ ๋ฉ ๋ชจ๋ธ ํ์ธํ๋ ๋ฐ ์ต์ ํ, ํด์ ๊ฐ๋ฅ์ฑ๊น์ง โ์ ์ฃผ์ฑ ์ดํด๋ณด๋ ๊ธ์ ๋๋ค.
๋ค๋ฃจ๋ ์ฃผ์ ๋ค
- ์๋ฒ ๋ฉ๊ณผ ๊ทธ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ(Generalizability)์ ๋ํ ๋ ผ์
- ์ธ๊ฐ๊ณผ + ...
Compiling CUDA with clang|๐|
clang++ axpy.cu -o axpy --cuda-gpu-arch=<GPU arch> \
-L<CUDA install path>/<lib64 or lib> \
-lcudart_static -ldl -lrt -pthread
./axpy
y[0] = 2
y[1] = 4
y[2] = 6
y[3] = 8
#include <iostream>
__global__ void axpy(float a, float* x, float* y) {
y[threadIdx.x] = a * x[threadIdx.x];
}
int main(int argc, char* argv[]) {
const int kDataLen = 4;
float a = 2.0f;
float host_x[kDataLen] = {1.0f, 2.0f, 3.0f, 4.0f};
float host_y[kDataLen];
// Copy input data to device.
float* device_x;
float* device_y;
cudaMalloc(&device_x, kDataLen * sizeof(float));
cudaMalloc(&device_y, kDataLen * sizeof(float));
cudaMemcpy(device_x, host_x, kDataLen * sizeof(float),
cudaMemcpyHostToDevice);
// Launch the kernel.
axpy<<<1, kDataLen>>>(a, device_x, device_y);
// Copy output data to host.
cudaDeviceSynchronize();
cudaMemcpy(host_y, device_y, kDataLen * sizeof(float),
cudaMemcpyDeviceToHost);
// Print the results.
for (int i = 0; i < kDataLen; ++i) {
std::cout << "y[" << i << "] = " << host_y[i] << "\n";
}
cudaDeviceReset();
return 0;
}
- June 24, 2025 ยท 15 min read | Christian Legnitto
- CubeCL์ Rust์์ GPU ์ปค๋์ ์์ฑํ ์ ์๋๋ก ํด์ฃผ๋ ๊ณ ์ฑ๋ฅ ๋ฉํฐํ๋ซํผ ์ธ์ด ํ์ฅ
- ํจ์, ์ ๋ค๋ฆญ, ๊ตฌ์กฐ์ฒด๋ฅผ ์๋ฒฝํ๊ฒ ์ง์ํ๋ฉฐ, ํน์ฑ, ๋ฉ์๋, ํ์ ์ถ๋ก ์ ๋ถ๋ถ์ ์ผ๋ก ์ง์
- WGPU, CUDA, ROCm ๊ธฐ๋ฐ ๋ฐํ์์ ์ง์ํ๋ฉฐ, SIMD ๋ช ๋ น์ด๋ฅผ ํ์ฉํ ์ต์ ํ๋ JIT CPU ๋ฐํ์๋ ๊ฐ๋ฐ์ค
- *โฆ
- Llama.cpp๊ฐ ์ด์ libmtmd๋ฅผ ํตํด ๋ฉํฐ๋ชจ๋ฌ ์
๋ ฅ(๋น์ ํฌํจ)์ ์ง์ํจ
- llama-mtmd-cli ๋๋ llama-server๋ฅผ ํตํ OpenAI ํธํ
/chat/completions
API
- llama-mtmd-cli ๋๋ llama-server๋ฅผ ํตํ OpenAI ํธํ
- Gemma 3, SmolVLM, Pixtral, Qwen 2/2.5, Mistra Small, InternVL ๋ฑ ๋ชจ๋ธ์์ ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ๋ฅ ์ฆ์ ์ฌ์ฉ ๊ฐ๋ฅํจ
- Pre-quantized ๋ชจ๋ธโฆ