본문 바로가기

알고리즘

[프로그래머스] 실패율(python)

https://school.programmers.co.kr/learn/courses/30/lessons/42889

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr

📌 문제 설명

슈퍼 게임 개발자 오렐리는 큰 고민에 빠졌다. 그녀가 만든 프랜즈 오천성이 대성공을 거뒀지만, 요즘 신규 사용자의 수가 급감한 것이다. 원인은 신규 사용자와 기존 사용자 사이에 스테이지 차이가 너무 큰 것이 문제였다.

이 문제를 어떻게 할까 고민 한 그녀는 동적으로 게임 시간을 늘려서 난이도를 조절하기로 했다. 역시 슈퍼 개발자라 대부분의 로직은 쉽게 구현했지만, 실패율을 구하는 부분에서 위기에 빠지고 말았다. 오렐리를 위해 실패율을 구하는 코드를 완성하라.

  • 실패율은 다음과 같이 정의한다.
    • 스테이지에 도달했으나 아직 클리어하지 못한 플레이어의 수 / 스테이지에 도달한 플레이어 수

전체 스테이지의 개수 N, 게임을 이용하는 사용자가 현재 멈춰있는 스테이지의 번호가 담긴 배열 stages가 매개변수로 주어질 때, 실패율이 높은 스테이지부터 내림차순으로 스테이지의 번호가 담겨있는 배열을 return 하도록 solution 함수를 완성하라.

✔️ 제한사항
  • 스테이지의 개수 N은 1 이상 500 이하의 자연수이다.
  • stages의 길이는 1 이상 200,000 이하이다.
  • stages에는 1 이상 N + 1 이하의 자연수가 담겨있다.
    • 각 자연수는 사용자가 현재 도전 중인 스테이지의 번호를 나타낸다.
    • 단, N + 1 은 마지막 스테이지(N 번째 스테이지) 까지 클리어 한 사용자를 나타낸다.
  • 만약 실패율이 같은 스테이지가 있다면 작은 번호의 스테이지가 먼저 오도록 하면 된다.
  • 스테이지에 도달한 유저가 없는 경우 해당 스테이지의 실패율은 0 으로 정의한다.
✔️ 입출력 예
N stages result
5 [2, 1, 2, 6, 2, 4, 3, 3] [3,4,2,1,5]
4 [4,4,4,4,4] [4,1,2,3]
✔️ 입출력 예 설명

입출력 예 #1
1번 스테이지에는 총 8명의 사용자가 도전했으며, 이 중 1명의 사용자가 아직 클리어하지 못했다. 따라서 1번 스테이지의 실패율은 다음과 같다.

  • 1 번 스테이지 실패율 : 1/8

2번 스테이지에는 총 7명의 사용자가 도전했으며, 이 중 3명의 사용자가 아직 클리어하지 못했다. 따라서 2번 스테이지의 실패율은 다음과 같다.

  • 2 번 스테이지 실패율 : 3/7

마찬가지로 나머지 스테이지의 실패율은 다음과 같다.

  • 3 번 스테이지 실패율 : 2/4
  • 4번 스테이지 실패율 : 1/2
  • 5번 스테이지 실패율 : 0/1

각 스테이지의 번호를 실패율의 내림차순으로 정렬하면 다음과 같다.

  • [3,4,2,1,5]

입출력 예 #2

모든 사용자가 마지막 스테이지에 있으므로 4번 스테이지의 실패율은 1이며 나머지 스테이지의 실패율은 0이다.

  • [4,1,2,3]

🗒 풀이

from collections import defaultdict


def solution(N, stages):
    answer = defaultdict(int)
    users = len(stages)
    for stage in range(1, N+1):
        if users != 0:
            count = stages.count(stage)
            answer[stage] = count / users
            users -= count
        else:
            answer[stage] = 0
    return sorted(answer, key=lambda x: answer[x], reverse=True)

answer은 필자가 자주 사용하는 정수형의 defaultdict으로, 저장되지 않은 키로 접근을 해도 KeyError를 일으키지 않고 설정해둔 초기값, 즉 여기서는 int를 default값으로 설정했으므로 0을 반환한다는 이점이 있다.

users는 게임을 이용하는 사용자의 수를 저장한 것으로, stages의 길이만큼이 게임 유저 수라는 점을 이용했다.

다음 for문을 순회한다. 이 때, stage는 1부터 있으므로 range도 1부터 시작함을 유의하자.

무튼 for문을 순회하면서, users가 0이 될 때까지 실패율(스테이지에 도달했지만 클리어하지 못한 유저 / 스테이지에 도달한 플레이어 수)을 계산한다.

count는 stages 배열에서 해당 stage의 개수를 카운트한 것이고, answer 딕셔너리에 해당 stage의 실패율을 계산해서 저장한다.

마지막으로 answer 딕셔너리의 value 값을 기준으로 내림차순 정렬하고, key의 값들을 반환한다.


🤔 후기

일단 문제를 보자마자 defaultdict를 사용해서 각각 얼마나 많은 유저들이 해당 스테이지를 성공했는지 확인 및 관리해주면 되겠다고 생각했다.

위의 풀이와 비슷한 플로우로 접근해서 다음과 같은 코드를 짰다.

from collections import defaultdict


def solution(N, stages):
    users = len(stages)
    user_stages = defaultdict(int)
    for stg in range(1, N+1):
        user_stages[stg] += stages.count(stg)
    user_stages = dict(sorted(user_stages.items()))

    answer = defaultdict(float)
    for k, v in user_stages.items():
        if k == (N + 1):
            answer[N] = 0.0
            break
        answer[k] = v / users
        users -= v

    return list(dict(sorted(answer.items(), key=lambda item: item[1], reverse=True)).keys())

풀이 코드에 비해 훨씬 길이도 길고, 지금보니 굳이 왜 썼을까? 싶은 코드도 있다. 아니나 다를까 런타임 에러가 났다.

다시 코드를 읽어보니, 굳이 실패율과 stage 성공 수 각각을 처리하는 것이 아니라, 한번에 처리할 수 있다는 것을 알았다.

그래서 풀이와 같이 한꺼번에 실패율을 저장하는 식으로 코드를 바꿨고, 다행이도 런타임 에러를 피할 수 있었다.

확실히 처음에 러프하게 코드를 짜다보면 테스트코드는 통과할 수 있어도, 런타임 에러는 피해갈 수 없었다. 짜고 나서 제출 전에 실행시간을 줄일 수 있는 방법을 고민하는 습관을 들이자.