목록✔ etc. (5)
근본없는 코딩

0. 지난 내용1) 컨텐츠기반 추천시스템 2) 컨텐츠를 활용할 수 있는지 3) 어떻게 컨텐츠들이 서로 연관이 있는지 평가하는 방법 4) 근접이웃기반 컨텐츠기반 추천시스템 -> k-nearest neighbor 5) naive bayes classifer -> 베이즈 추천시스템 6) TF-IDF 개념설명 그리고 실습 📌 추천 시스템 성능 평가 → RMSE 1. Dataset 불러오기. 필요한 데이터들을 불러온다.# 각자 작업 환경에 맞는 경로를 지정해주세요. Google Colab과 Jupyter환경에서 경로가 다를 수 있습니다.path = '/content/drive/MyDrive/Colab Notebooks'ratings_df = pd.read_csv(os.path.join(path, 'ratings..

1. Vector Representation (벡터 표현)** vector representation은 텍스트를 벡터로 표현하는 방법으로 텍스트를 벡터공간 상의 점으로 표시한다.. m개의 review 문서가 있다고 가정하자.. review 문서 전체에 등장하는 단어의 수는 n개이다.. 각 항목은 해당 단어가 review에 등장하는 빈도수를 의미한다.ex) (Review 1, Word 0) = 2 → Review 1에 Word 0은 2번 등장한다. 2. Term Vector Representation (단어 벡터 표현)* Term Weight (단어 가중치). (i, j) = weight. Term Frequency Vector: 단어의 빈도수로 벡터를 나타냄. 문서 i에서의 단어 j의 중요도 * TF -..

Contents-based Recommender System 나이브 베이즈 추천 알고리즘 📌 확률(Probability)- 사건(Event) A가 발생할 가능성- P(A) = 사건 A의 경우의 수 / 전체 경우의 수 📌 조건부 확률(Conditional Probability) 📌 베이즈 정리(Bayes' Theorem) . Confusion Matrix→ Training을 통한 Prediction 성능을 측정하기 위해 예측 value와 실제 value를 비교하기 위한 표→ TP와 TN은 실제 값을 맞게 예측한 부분이며, FP와 FN은 실제 값과 다르게 예측한 부분을 의미① TP (True Positive): 예측을 Positive로 했는데, 맞춘 경우② TN (True Negative): 예측을..

재해 복구 . 재해란 회사의 사업 지속이나 재정에 부정적인 영향을 미치는 이벤트. . 재해복구는 이러한 재해에 대비하고 재해가 발생할 시, 복구하는 작업 재해복구시스템 개요 및 평가 지표 The Nines . 연중 무휴로 동작해야하는 컴퓨터에서, 100% 가동 시간을 보장할 수 없다. . 시스템의 문제 뿐만아니라 자연재해, 시민불안, 전력 손실과 같은 물리적 재해에 대한 계획도 필요하다. → 사실 AWS, Google Colud, Azure와 같은 서비스를 이용하는 장점은 이러한 부분에 대해서 신경쓸 필요가 없다는 점도 있다. . 하지만, SW측면에서는 여전히 복구 계획을 마련해야 한다. ✔️ 나인스(The Nines) . 온라인 서비스의 가동시간 수준을 측정하는 방법. . 9의 개수에 따라 보장..

✔️ HTTP란? . Hyper Text Transfer Protocol의 준말로, 하이퍼 미디어 문서를 전송하기 위한 애플리케이션 레이어 프로토콜 . 하이퍼 미디어 문서? 웹상에서 돌아다니는 정보들 . Application 레이어는 최상층에 위치하고 있다. . 따라서 데이터를 주고 받기 위해서는, 아래의 하위 계층들을 다 지나갔다 와야한다. ➕ TCP vs. UDP . TCP는 연결형 → 데이터를 주고 받기 전 연결을 확인하는 과정을 거친다(3 Way-Handshake). . UDP는 비연결형 → 일단 데이터 보내고 받았으면 오케이! ✔️ HTTP 1.1 . 전송 계층 프로토콜 TCP를 사용 . http1.0의 문제를 해결하기 위해 출시 . http2.0의 출시 전까지 약 15년간 주로 사용됨 ⚠️ H..