coding test

[파이썬, Java] [1차] 캐시

잔망루피 2021. 8. 26. 21:18

문제 설명

캐시

지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다.
이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다.
어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.

어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오.

입력 형식

  • 캐시 크기(cacheSize)와 도시이름 배열(cities)을 입력받는다.
  • cacheSize는 정수이며, 범위는 0 ≦ cacheSize ≦ 30 이다.
  • cities는 도시 이름으로 이뤄진 문자열 배열로, 최대 도시 수는 100,000개이다.
  • 각 도시 이름은 공백, 숫자, 특수문자 등이 없는 영문자로 구성되며, 대소문자 구분을 하지 않는다. 도시 이름은 최대 20자로 이루어져 있다.

출력 형식

  • 입력된 도시이름 배열을 순서대로 처리할 때, "총 실행시간"을 출력한다.

조건

  • 캐시 교체 알고리즘은 LRU(Least Recently Used)를 사용한다.
  • cache hit일 경우 실행시간은 1이다.
  • cache miss일 경우 실행시간은 5이다.

입출력 예제

캐시크기
(cacheSize)
도시이름(cities) 실행시간
3 ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "Jeju", "Pangyo", "Seoul", "NewYork", "LA"] 50
3 ["Jeju", "Pangyo", "Seoul", "Jeju", "Pangyo", "Seoul", "Jeju", "Pangyo", "Seoul"] 21
2 ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "SanFrancisco", "Seoul", "Rome", "Paris", "Jeju", "NewYork", "Rome"] 60
5 ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "SanFrancisco", "Seoul", "Rome", "Paris", "Jeju", "NewYork", "Rome"] 52
2 ["Jeju", "Pangyo", "NewYork", "newyork"] 16
0 ["Jeju", "Pangyo", "Seoul", "NewYork", "LA"] 25

해설 보러가기

 

카카오 신입 공채 1차 코딩 테스트 문제 해설

‘블라인드’ 전형으로 실시되어 시작부터 엄청난 화제를 몰고 온 카카오 개발 신입 공채. 그 첫 번째 관문인 1차 코딩 테스트가 지난 9월 16일(토) 오후 2시부터 7시까지 장장 5시간 동안 온라인

tech.kakao.com

 

 

🥰 나의 풀이

from collections import deque

hashSet = set()  # 중복 체크
doublyQueue = deque()

def LRUCache(cacheSize, page):
    global hashSet
    global doublyQueue
    ans = 1

    if page not in hashSet:  # set에 없으면(cache miss)
        ans=5
        if cacheSize == len(doublyQueue): 	 # cacheSize만큼 가득차면
            last = doublyQueue.pop()        
            hashSet.discard(last)
    else:       # cache hit
        if doublyQueue :
            doublyQueue.remove(page)  

    doublyQueue.appendleft(page)  # 가장 왼쪽에 추가
    hashSet.add(page)

    return ans

# 소문자 변환
def lowcase(cities) :
    for i in range(len(cities)) :
        cities[i]=cities[i].lower()

def solution(cacheSize, cities):  # 캐시 크기, 도시이름 배열
    answer = 0
    if cacheSize == 0 : return len(cities)*5
    lowcase(cities)
    for city in cities:
        answer += LRUCache(cacheSize, city)

    return answer  # 총 실행시간

 

LRU 알고리즘이 뭔지 몰라서 검색해보니 아래 사이트가 나왔고, java 코드를 참고해서 파이썬을 작성할 수 있었다.

https://www.geeksforgeeks.org/lru-cache-implementation/

 

LRU Cache Implementation - GeeksforGeeks

A Computer Science portal for geeks. It contains well written, well thought and well explained computer science and programming articles, quizzes and practice/competitive programming/company interview Questions.

www.geeksforgeeks.org

LRU 알고리즘은 캐시가 가득 찼을때, 캐시에 없는 다른 페이지를 넣기 위해 사용한지 가장 오래된 페이지를 제거하는 알고리즘이다.

0인덱스에 있는 페이지가 가장 최신의 것이고, 오른쪽으로 갈수록 오래된 것이다.

lowcase 메소드는 리스트 안의 각 문자열을 소문자로 변환한다. 문제조건에 대소문자 구분 하지 않는다고 함.

cache hit은 삽입하려는 페이지가 이미 캐시 안에 있으면 원래 있던 페이지를 0인덱스 위치에 옮기는 것이다.

아래 두단계가 cache hit 구현에 대한 설명

1. set에 이미 삽입하려는 페이지가 존재하면 같은 페이지를 remove로 지운다.

2. appendleft로 페이지를 캐시에 추가한다.

cache miss는 캐시 안에 삽입하려는 페이지가 존재하지 않을 때를 뜻한다.

 

 

import java.util.*;

class Solution {
    public static LinkedHashSet<String> set;

    public int LRU(int cacheSize, String city){
        int cnt=5;			// cache miss
        if(set.contains(city)){   // cache hit
            cnt=1;
            set.remove(city);
        }

        set.add(city);      // 오른쪽으로 갈수록 최신
        if(set.size() > cacheSize){     // 가득 찼을 때
            String first=set.iterator().next();
            set.remove(first);
        }

        return cnt;
    }

    public int solution(int cacheSize, String[] cities) {
        int answer = 0;
        set=new LinkedHashSet<>(cacheSize);
        for(String city : cities){
            String lowercase=city.toLowerCase();   // 소문자 변환
            answer+=LRU(cacheSize, lowercase);
        }

        return answer;
    }
}

LinkedHashSet은 순서가 유지되는 집합이다.

오른쪽에 있을수록 최근이다.

캐시가 가득차면 iterator를 사용해서 맨 앞에 있는 값을 제거한다.

 

 

📌 다른 사람 풀이

 

import collections
def solution(cacheSize, cities) :
    cache=collections.deque(maxlen=cacheSize)
    time=0
    for i in cities :
        s=i.lower()
        if s in cache :
            cache.remove(s)
            cache.append(s)
            time+=1
        else :
            cache.append(s)
            time+=5
    return time

 

너무 간결해서 놀랐다 

deque에서 maxlen을 설정해서 크기를 제한할 수 있구나

maxlen만큼 deque의 길이가 찼는데 값이 들어오면 첫번째 값이 삭제된다. (cache 사이즈를 확인하는 if문이 없는 이유)

내 코드를 생각해보니 python에 in 때문에 굳이 set을 사용할 필요가 없다.

문제에서는 순서를 고려해야 할 것 같은 느낌이지만 그렇게 하지 않아도 푸는데 지장이 없다.

s가 cache에서 어느 위치에 있든 중복되면 remove로 제거 후 append해주면 된다.

 

 

 

문제 출처 👉 프로그래머스

반응형

'coding test' 카테고리의 다른 글

[파이썬, Java] [1차] 다트 게임  (0) 2021.08.27
[파이썬] [1차] 비밀지도  (0) 2021.08.27
[파이썬] [1차] 프렌즈4블록  (0) 2021.08.20
[파이썬] 후보키  (0) 2021.08.16
[파이썬, Java] 거리두기 확인하기  (0) 2021.08.10