https://programmers.co.kr/learn/courses/30/lessons/17677
코딩테스트 연습 - [1차] 뉴스 클러스터링
뉴스 클러스터링 여러 언론사에서 쏟아지는 뉴스, 특히 속보성 뉴스를 보면 비슷비슷한 제목의 기사가 많아 정작 필요한 기사를 찾기가 어렵다. Daum 뉴스의 개발 업무를 맡게 된 신입사원 튜브
programmers.co.kr
먼저 map을 이용해서 {특정문자열, 존재하는 개수}의 형태로 주어지는 string에 대하여 map을 만들어준다. (코드에서 makeMap 함수)
만들기 전에, 대소문자는 구분하지 않는다는 조건을 처리하기 위해서 주어지는 문자열을 모두 소문자로 변환한다.
대문자로 변환해도 무관하다.
그리고 공집합인 경우를 처리한다.
교집합의 경우, 비어있는 map을 생성하고, 한 문자열에 대한 map의 원소가 다른 문자열의 map 원소에 존재하는지 확인하면서, 존재하는 경우에만 새로운 map에 추가해주면 된다.
이 때, 교집합에서는 특정원소의 존재하는 개수는 min 값을 사용하기 때문에, 더 작은 값을 넣어주면 된다.
합집합의 경우, 특정 문자열의 map에 다른 문자열 map의 원소를 합쳐주면 된다. 따라서 존재하지 않는 경우에는 새롭게 추가해주고, 존재하는 경우에는 더 큰 개수의 값을 넣어주면 된다.
#include<bits/stdc++.h>
using namespace std;
map<string, int> mp1, mp2;
map<string, int> makeMap(string str){
map<string, int> mp;
for(int i = 0 ; i < str.length()-1 ; i++){
// 알파벳 아닌 문자 거르기
if(!('a' <= str[i] && str[i] <= 'z'))
continue;
else if(!('a' <= str[i+1] && str[i+1] <= 'z'))
continue;
string key = str.substr(i, 2);
if(mp.find(key) == mp.end()){
mp.insert({key, 1}); //map에 없으면 추가
}
else{
mp[key]++; //있으면 개수 증가
}
}
return mp;
}
int solution(string str1, string str2) {
int answer = 0;
// 전부 소문자로 바꾸기
transform(str1.begin(), str1.end(), str1.begin(), ::tolower);
transform(str2.begin(), str2.end(), str2.begin(), ::tolower);
mp1 = makeMap(str1); //집합 생성
mp2 = makeMap(str2);
if(mp1.size() == 0 && mp2.size() == 0){ // 공집합이라 연산 불가능
return 65536;
}
int down = 0, up = 0; //분자, 분모
map<string, int> res; //합집합
for(auto itr1 = mp1.begin() ; itr1 != mp1.end() ;itr1++){
string cur = itr1->first;
if(mp2.find(cur) != mp2.end()){
//있으면(없으면 처리할 게 없음)
res.insert({cur, min(itr1->second, mp2[cur])});
}
up += res[cur];
}
//교집합
for(auto itr2 = mp2.begin() ; itr2 != mp2.end() ; itr2++){
string cur = itr2->first;
if(mp1.find(cur) != mp1.end()){
// 있으면
mp1[cur] = max(itr2->second, mp1[cur]);
}
else{
//없으면
mp1.insert({cur, itr2->second});
}
}
//분모계산(교집합)
for(auto itr1 = mp1.begin() ; itr1 != mp1.end() ;itr1++){
down += itr1->second;
}
answer = up*65536/down;
return answer;
}