lstm(3)
-
A Multi-label Hate Speech Detection Dataset
1. A Multi-label Hate Speech Detection Dataset A Multi-label Hate Speech Detection Dataset은 혐오 발언(hate speech)을 더 세분화하여 여러 개의 혐오 범주를 동시에 라벨링한 데이터셋입니다. 기존의 혐오 발언 탐지 데이터셋은 보통 특정 문장이 혐오 발언인지 아닌지를 이진 분류(Binary Classification)로 다루었지만, 다중 라벨(Multi-label) 데이터셋은 한 문장이 여러 개의 혐오 범주(예: 인종 차별, 성차별, 종교적 혐오 등)에 동시에 해당할 수 있음을 반영합니다. 이러한 데이터셋은 혐오 발언 탐지 모델이 더 정교하게 학습할 수 있도록 도와주며, 소셜 미디어 및 온라인 플랫폼에서 보다 정확한 콘텐츠 모니..
2025.02.13 -
LSTM과 GRU
1. LSTMLSTM(Long Short-Term Memory)은 RNN의 장기 의존성 문제를 해결하기 위해 고안된 모델입니다. LSTM은 셀 상태(cell state)와 3개의 게이트(입력 게이트, 출력 게이트, 망각 게이트)를 사용하여 중요한 정보를 오랫동안 저장하고 불필요한 정보를 제거하는 구조를 갖추고 있습니다. 망각 게이트는 이전 셀 상태에서 필요 없는 정보를 삭제하고, 입력 게이트는 새로운 정보를 저장하며, 출력 게이트는 최종 출력을 결정합니다. 이러한 구조 덕분에 LSTM은 장기 시퀀스를 다루는 자연어 처리, 음성 인식, 시계열 예측 등의 다양한 분야에서 효과적으로 사용됩니다. 하지만 구조가 복잡하여 계산량이 많고, 학습 시간이 오래 걸린다는 단점이 있습니다. !pip install ko..
2025.02.10 -
RNN
1. RNNRNN(Recurrent Neural Network, 순환 신경망)은 시계열 데이터나 연속적인 데이터를 다룰 때 사용되는 인공 신경망으로, 일반적인 신경망(CNN, MLP 등)이 입력을 한 번 처리하고 끝나는 것과 달리, 과거의 정보를 기억하며 다음 계산에 반영하는 특징이 있습니다. 일반적인 신경망은 현재 입력만 보고 예측하지만, 시계열 데이터나 자연어처럼 이전 정보가 중요한 경우에는 적절하지 않기 때문에 RNN이 필요합니다. RNN은 기존 신경망과 달리 자신의 출력을 다시 입력으로 사용하여 과거 정보를 기억하는 구조를 가지며, 이를 통해 시계열 데이터의 패턴을 학습할 수 있습니다. 그러나 일반적인 RNN은 장기 의존성(Long-Term Dependency) 문제로 인해 학습이 어려울 수 있..
2025.02.05