coding test

[파이썬, Java] 신규 아이디 추천

잔망루피 2021. 4. 26. 16:53

문제 설명

카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.

  • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
  • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
  • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,

1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다. 2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다. 3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다. 4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다. 5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다. 6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다. 7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.


예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.

1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm"  "...!@bat#*..y.abcdefghijklm"

2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
"...!@bat#*..y.abcdefghijklm"  "...bat..y.abcdefghijklm"

3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm"  ".bat.y.abcdefghijklm"

4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm"  "bat.y.abcdefghijklm"

5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm"  "bat.y.abcdefghijklm"

6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm"  "bat.y.abcdefghi"

7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi"  "bat.y.abcdefghi"

따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.


[문제]

신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, "네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.

 

[제한사항]

new_id는 길이 1 이상 1,000 이하인 문자열입니다.
new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.


 

[입출력 예]

no new_id result
예1 "...!@BaT#*..y.abcdefghijklm" "bat.y.abcdefghi"
예2 "z-+.^." "z--"
예3 "=.=" "aaa"
예4 "123_.def" "123_.def"
예5 "abcdefghijklmn.p" "abcdefghijklmn"

 

입출력 예에 대한 설명


입출력 예 #1
문제의 예시와 같습니다.

입출력 예 #2
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.

1단계 변화 없습니다.
2단계 "z-+.^."  "z-.."
3단계 "z-.."  "z-."
4단계 "z-."  "z-"
5단계 변화 없습니다.
6단계 변화 없습니다.
7단계 "z-"  "z--"

입출력 예 #3
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.

1단계 변화 없습니다.
2단계 "=.="  "."
3단계 변화 없습니다.
4단계 "."  "" (new_id가 빈 문자열이 되었습니다.)
5단계 ""  "a"
6단계 변화 없습니다.
7단계 "a"  "aaa"

입출력 예 #4
1단계에서 7단계까지 거치는 동안 new_id("123_.def")는 변하지 않습니다. 즉, new_id가 처음부터 카카오의 아이디 규칙에 맞습니다.

입출력 예 #5
1단계 변화 없습니다.
2단계 변화 없습니다.
3단계 변화 없습니다.
4단계 변화 없습니다.
5단계 변화 없습니다.
6단계 "abcdefghijklmn.p"  "abcdefghijklmn."  "abcdefghijklmn"
7단계 변화 없습니다.

 

 

👸 나의 풀이

 

def solution(new_id):   #  신규 유저가 입력한 아이디
    answer = ''
    
    # 1. 모든 대문자를 소문자로 치환 
    new_id=new_id.lower()
    
    # 2. 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거
    for n in new_id :
        if n.isalnum() or n in "-_." :
            answer+=n
    
    # 3. new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환
    while ".." in answer :
        answer=answer.replace("..",".")
        
    # 4. new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거
    if answer and answer[0] == ".":
        answer=answer[1:]
    if answer and answer[-1] =="." :
        answer=answer[:-1]
            
    # 5. new_id가 빈 문자열이라면, new_id에 "a"를 대입
    if not answer :
        answer+='a'
    
    # 6. new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거.
    # 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거
    if len(answer) >= 16 :
        if answer[14] == "." :
            answer=answer[:14]
        else :
            answer=answer[:15]
            
    # 7. new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
    if len(answer) <= 2 :
        temp=answer[-1]
        while len(answer) != 3 :
            answer+=temp

    return answer

 

문자열 함수를 잘 사용하면 되는 문제

3번은 2번 이상 연속된 부분들을 제대로 .로 치환하기 위해 while을 썼다.

4번 구현할 때 index error 떠서 answer 처음과 끝을 체크하기 전에 answer에 원소가 있는지 확인했다.

 

👶 느낀점

입력받은 new_id를 변형시켜 나가는 것보다 다른 문자열 변수 만들어서 조건에 맞는 것을 담아가는게 더 나음.

2단계에서 빼기(-), 밑줄(_), 마침표(.)를 딕셔너리에 넣고 in을 했는데 굳이 이렇게 할 필요없음.

바로 "-_."하면 됨.

 

 

import java.util.*;
import java.util.regex.*;
class Solution {
    public String solution(String new_id) {
        // 1. 소문자로 치환
        String answer=new_id.toLowerCase();
        
        // 2. 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거
        Pattern pattern=Pattern.compile("[a-z 0-9 \\- \\_ \\.]*");
        Matcher matcher=pattern.matcher(answer);
        String answer2="";
        while (matcher.find()){
            answer2+=matcher.group();
        }
        
        // 3. .가 2번 이상 연속된 부분을 하나의 마침표로 치환
        while(answer2.contains("..")){
            answer2=answer2.replace("..", ".");
        }
        
        //4. .가 처음이나 끝에 있으면 제거
        //StringBuffer answer4=new StringBuffer(answer2);
        if(answer2.startsWith(".")) answer2=answer2.substring(1);
        if(answer2.endsWith("."))   answer2=answer2.substring(0, answer2.length()-1);    
        //5. new_id가 빈 문자열이라면, new_id에 "a"를 대입
        if(answer2.length() == 0) answer2+="a";
        
        // 6. new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거
        // 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
        if(answer2.length() >= 16) answer2=answer2.substring(0, 15); 
        if(answer2.endsWith(".")) answer2=answer2.substring(0, answer2.length()-1);
        

        // 7. new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
        if(answer2.length() <= 2){
            char last=answer2.charAt(answer2.length()-1);
            while(answer2.length() != 3) answer2+=last;
        }
        

        return answer2;
    }
}

 

자바의 Pattern, Matcher 클래스를 사용해서 정규 표현식을 만듦.

. 또는 _ 같은 문자 기호들은 \\를 두번 써야함.

삭제하는 부분에서 StringBuffer 만들어서 썼다가 뒤로 갈수록 코드가 복잡해져서 뺏다🙄

 

 

🧚‍♀️ 다른 사람 풀이

 

import re

def solution(new_id) :
    st=new_id
    st=st.lower()   # 소문자로 변환
    st=re.sub('[^a-z0-9\-_.]', '', st)	# 소문자, 숫자, -, _, .을 제외한 나머지는 ''
    st=re.sub('\.+', '.', st)		# 1개 이상의 .들은 .으로 치환
    st=re.sub('^[.]|[.]$', '', st)		# .이 처음 또는 마지막에 있으면 ''
    st='a' if len(st) == 0 else st[:15]		# st가 비어있으면 'a'
    st=re.sub('^[.]|[.]$', '', st)		# 시작이 .이거나 마지막에 있으면 ''
    st=st if len(st)>2 else st+"".join([st[-1] for i in range(3-len(st))])
    return st

 

정규 표현식을 사용한 풀이

sub("바꿀 문자열", "대상 문자열", count=바꾸기 횟수)

sub()로 정규식과 매치되는 부분을 다른 문자로 바꾼다.

[] 사이의 문자들과 매치한다.

[a-z], [0-9]에서 -는 두 문자 사이의 범위를 뜻한다.

^는 문자열의 처음, $는 문자열의 마지막을 의미

[] 안에 ^를 쓰면 '반대'를 의미한다.

|는 or이다.

.은 \n을 제외한 모든 문자와 매치됨

a.b		# a[.]b와 다르다

a와 b사이에 어떤 문자가 들어가도(줄바꿈 문자 제외) 모두 매치됨

[.].이다

+는 1번 이상 반복

 

 

from re import sub

def solution(new_id) :
    new_id=new_id.lower()
    new_id=sub("[^a-z0-9-_.]", "", new_id)
    new_id=sub("\.+", ".", new_id)
    new_id=sub("(^\.|\.$)", "", new_id)
    new_id=new_id if new_id else "a"
    new_id=sub("\.$", "", new_id[:15])
    new_id=new_id if len(new_id)>3 else new_id+new_id[-1]*(3-len(new_id))
    return new_id

메타 문자에서 .은 \n을 제외한 모든 문자와 매치라는 의미를 갖기 때문에 \.을 써야 .이다.

 

 

# https://velog.io/@djagmlrhks3/Algorithm-Programmers-%EC%8B%A0%EA%B7%9C-%EC%95%84%EC%9D%B4%EB%94%94-%EC%B6%94%EC%B2%9C-by-Python
def solution(new_id):
    # 1단계
    new_id = new_id.lower()
    # 2단계
    answer = ''
    for word in new_id:
        if word.isalnum() or word in '-_.':
            answer += word
    # 3단계
    while '..' in answer:
        answer = answer.replace('..', '.')
    # 4단계
    answer = answer[1:] if answer[0] == '.' and len(answer) > 1 else answer
    answer = answer[:-1] if answer[-1] == '.' else answer
    # 5단계
    answer = 'a' if answer == '' else answer
    # 6단계
    if len(answer) >= 16:
        answer = answer[:15]
        if answer[-1] == '.':
            answer = answer[:-1]
    # 7단계
    if len(answer) <= 3:
        answer = answer + answer[-1] * (3-len(answer))
    return answer

 

내 풀이와 크게 다른 점은 없다.

answer = answer + answer[-1] * (3-len(answer))

이 부분은 창의적이었다. answer의 마지막 문자를 3-answer의 길이만큼 덧붙여준다.

 

 

// https://minhamina.tistory.com/121
class Solution{
    public String solution(String new_id){
        String id=new_id.toLowerCase();     // 소문자로
        id=id.replaceAll("[^-_.a-z0-9]", "");   // -_. 영문자 숫자만 남김
        id=id.replaceAll("[.]{2,}", ".");   // .2개 이상 .으로
        id=id.replaceAll("^[.]|[.]$", "");  // 처음과 끝 . 제거
        
        if(id.equals(""))   // 빈 문자열이라면 a 추가
            id+="a";
        
        if(id.length() >= 16){  // 16자 이상이면 15자로
            id=id.substring(0, 15);
            id=id.replaceAll("^[.]|[.]$", "");      // 끝 . 제거
        }
        if(id.length() <= 2)    // 2자 이하라면 3자까지 마지막 문자 추가
            while(id.length() < 3)
                id+=id.charAt(id.length()-1);
        
        return id;
    }
}

 

replaceAll을 사용하면 정규표현식이 간결해진다.

[ ] 안에 ^는 not을 의미함.

[^-_.a-z0-9]는 소문자, 숫자, -, _, .이 아닌 문자를 의미한다. 이 문자들을 제외한 문자는 ""로 치환되므로 삭제되는 효과

{ } 안에 숫자를 기입하면 반복 횟수다.

[.]{2,}는 .이 2개 이상이라는 뜻이다.

^은 시작, $은 종료다.

^[.]|[.]$은 .으로 시작하거나 .으로 종료한다는 뜻이다.

 

 

 

문제 출처 💁‍♀️ 프로그래머스

반응형

'coding test' 카테고리의 다른 글

[파이썬] 8958. OX퀴즈  (0) 2021.04.28
[파이썬] 음양 더하기  (0) 2021.04.27
[파이썬, Java] 위장  (0) 2021.04.23
[파이썬, Java] 타겟 넘버  (0) 2021.04.23
[파이썬, Java] 모의고사  (0) 2021.04.23