본문 바로가기

Training3

Grey-box Adversarial Attack And Defence For Sentiment Classification - 번역 Grey-box Adversarial Attack And Defence For Sentiment Classification 중요하다고 생각하는 부분만 적는다는 마음으로 글을써본다. Abstract 감성분석을 위한 grey-box Adversarial attack 과 defence 프레임워크를 소개한다. 우리의 결과들은 일단 학습되면, attacking 모델은 고품질의 Adversarial example 들을 SOTA attacking 방법들보다 상당히 빠르게 만들 수 있다는 것을 보여준다. 코드를 보고 싶다면 Github 로 가서 보면 됩니다. 1. Introduction 이 분야의 연구는 크게 Adversarial machine learning 으로 분류되고 작게는 target 모델들을 바보로 만드는 .. 2022. 4. 28.
Universal Adversarial Triggers for Attacking and Analyzing NLP - 번역 (2) Universal Adversarial Triggers for Attacking and Analyzing NLP (2) 영어실력의 부족으로 번역에 문제가 좀 있을 수 있으니 오역의 부분이 있다면 댓글을 달아주시면 좋을듯 함 3. Attacking Text Classification Sentiment Analysis 우리는 binary Stanford Sentiment Treebank 를 사용한다. 우리는 word2vec 또는 ELMo 임베딩을 사용한 Bi-LSTM 모델들을 고려한다. word2vec 과 ELMo 모델들은 각각 86.4% 와 89.6% 의 정확도를 달성했다. 우리는 SNLI 를 사용하여 자연어 추론을 고려한다. 우리는 Enhanced Sequential Inference(ESIM) 와 Gl.. 2022. 4. 25.
Universal Adversarial Triggers for Attacking and Analyzing NLP - 번역 (1) Universal Adversarial Triggers for Attacking and Analyzing NLP 영어실력의 부족으로 번역에 문제가 좀 있을 수 있으니 오역의 부분이 있다면 댓글을 달아주시면 좋을듯 함 Abstract Adversarial Example 들은 모델의 취약성을 강조하고 평가와 해석을 위해 유용하다. 우리는 universal Adversarial trigger 를 정의한다. universal Adversarial trigger 는 데이터셋에서의 어떤 input 에 연결했을때도 모델이 특정한 prediction 을 생성하게 유발하는 input 에 구애받지 않는 토큰의 sequence 라고 한다. 우리는 target prediction 을 성공적으로 유발하는 짧은 trigger s.. 2022. 4. 25.