欲速不達

일을 급히 하고자 서두르면 도리어 이루지 못한다.

Fantastic AI, Fantastic World

DS | Data Science/Alogithm & Coding Test - Python

[프로그래머스] 고득점 Kit - 해시 : 베스트앨범(파이썬)

_껀이_ 2022. 9. 30. 18:35
728x90
반응형

1. 문제설명

스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.

1) 속한 노래가 많이 재생된 장르를 먼저 수록합니다.
2) 장르 내에서 많이 재생된 노래를 먼저 수록합니다.
3) 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.


노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.

 

 

2. 제한 사항

genres [i]는 고유번호가 i인 노래의 장르입니다.
plays [i]는 고유번호가 i인 노래가 재생된 횟수입니다.
genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
장르 종류는 100개 미만입니다.
장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
모든 장르는 재생된 횟수가 다릅니다.

 

 

3. 입출력 예시

 

4. 문제풀이

 

일단 무턱대고 풀어봤다. 결과는 아래와 같다.

  • 1차 시도
def solution(genres, plays):
    answer, answer_ = [], []
    
    genres_set = list(set(genres))
    for j in range(len(genres_set)):
        list_g = []
        for i in range(len(genres)):
            if genres_set[j]==genres[i]:
                list_g.append(plays[i])
        sort_list_g = sorted(list_g,reverse=True)
        answer_.append(sort_list_g)
    
    answer_ = sorted(answer_,reverse=True)
    
    for h in answer_:
        if len(h)>1:
            for a in h[:2]:
                answer.append(plays.index(a))
        else:
            answer.append(plays.index(h[0]))
                
    print(answer)
                  
    
    return answer

테스트케이스에서는 정답이었지만, 코드 제출에서는 20/100 이었다. 문제가 뭘까.

아마 set를 사용해서 시간이 오래걸린 것이나, 복잡도 문제였을 것 같다.

 

계속 붙잡고 있는건 시간 낭비일것 같아서 다른 사람들의 풀이를 참고하기로 했다.

 

일단 문제접근이 달랐다.

해시 문제이기 때문에 딕셔너리로 하는 경우가 많은 것 같았다. 

 

수정한 코드는 아래와 같다.

 

 

  • 2차 시도
def solution(genres, plays):
    answer = []
    dic_genres = {}
    
    for i in genres:
        dic_genres[i]=[]

    for j in dic_genres.keys():
        for h in range(len(genres)):
            if genres[h] == j:
                dic_genres[j].append(plays[h])
        dic_genres[j] = sorted(dic_genres[j],reverse=True)
    
    sorted_key = dict(sorted(dic_genres.items(),key=lambda x: sum(x[1]),reverse=True))
    
    for v in sorted_key.values():
        if len(v)>1:
            for vi in v[:2]:
                answer.append(plays.index(vi))
        else:
            answer.append(plays.index(v[0]))
    
    return answer

딕셔너리로 고치니까 86.7 / 100 정도의 점수가 나왔다. 리스트로 구현했을때는 정렬하는 기준점을 제대로 설정하지 못했던 것 같다.

두개가 틀렸는데 이번엔 뭐가 문젤까. 

 

  • 3차 시도
def solution(genres, plays):
    answer = []
    dic_genres, dic_sum = {}, {}
    
    for i in range(len(genres)):
        if genres[i] in dic_genres: # 같은 장르내에서 같은 재생수를 가지는 인덱스도 표시하기 위한 조치
            dic_genres[genres[i]].append([plays[i],i])
        else:
            dic_genres[genres[i]]=[[plays[i],i]]
        dic_sum[genres[i]]=0

    for j in dic_genres.keys(): # sort의 기준점이 재생수의 총합과 인덱스이기 때문에
        for i in dic_genres[j]:
            dic_sum[j]+=i[0]

    # 재생 수 총합으로 장르를 내림차순 정렬
    sorted_sum = dict(sorted(dic_sum.items(),key=lambda x:x[1],reverse=True))
    res = {}
    for a in sorted_sum.keys(): 
        # dic_genres[a] 값에서 index 0은 내림차순, index 1은 오름차순 정렬
        aa = sorted(dic_genres[a], key=lambda x:(-x[0],x[1]))
        res[a]=aa
    
    # 길이가 1보다 크면 2개까지, 1개면 그대로 출력
    for v in res.values():
        if len(v)>1:
            for vi in v[:2]:
                answer.append(vi[1])
        else:
            answer.append(v[0][1])
    
    return answer

모두 정답이 나왔다.

2차 시도까지에서 잘못하고 있던 부분이 문제설명의 ''3) 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다."를 놓치고 있었다. 해당 부분을 고쳐주니 해결되었다.

 

 

5. 회고

- sorted()를 할때 key 값을 기억하자. 이때 key 값은 무엇을 기준으로 정렬을 할지에 대한 기준이 된다.

- 아이디어는 얼추 맞았지만, 제한사항에 대해서도 꼼꼼하게 체크해야된다. 

 

728x90
반응형