본문 바로가기

개발 관련/etc

(19)
s3 데이터 가져와서 DB에 import 하기 (pandas, boto3) s3에 올려둔 csv 데이터를 가져와서 pandas로 데이터프레임 형식으로 데이터를 읽은 후, 원하는 테이블에 import하고 싶었다. 일단 boto3을 사용하여 s3 데이터를 불러온다. s3 데이터를 가져오기 위해선, 접근 키 아이디와 비밀번호, 그리고 지역이 필요하다. 접근 키 아이디와 비밀번호는 AWS 계정을 생성한 후 IAM에서 사용자를 생성하는 과정에서 확인할 수 있다. 참고로 IAM은 AWS 리소스에 대한 접근을 안전하게 제어할 수 있는 서비스다. 아무튼 IAM을 생성하고 나서, 해당 키를 csv 파일로 보관해놨기 때문에 쉽게 찾을 수 있었다. 다운을 안받았다면 AWS 콘솔에서 IAM을 검색하고 사용하면 된다. 지역도 같이 확인한다. 혹시 지역이 정확히 기억이 안난다면, 다음 페이지를 확인하자..
IntelliJ에서 java와 python 같이 사용하기 알고리즘을 풀면서 자바로도, 파이썬으로도 같이 풀고 싶어졌다. 인텔리제이에서 파이썬 인터프리터를 추가해주면 되는 것이었다. 다음과 같이 설정한다. [File] - [Project Structure] 클릭 Plaform Settings에서 [SDKs] - [Add Python SDK...] 클릭 다음 [System Interpreter] 클릭 후, 원하는 인터프리터를 지정하고 [OK]를 눌러주면 된다.
아스키(ASCII) 아스키(ASCII) 아스키 코드, 즉 ASCII는 'American Standard Code for Information Interchange'의 약어로, 정보 교환을 위한 미국 표준 코드란 뜻이다. 아스키는 128개(=$ 2^7 $)의 문자 집합을 제공하는 7 bit 부호이다. 처음 32개의 문자는 인쇄와 전송 제어용으로 사용되는 제어문자로 출력할 수 없고, 마지막 문자를 제외한 33번째 이후의 문자들은 출력할 수 있는 문자들로, 기호와 숫자, 영대소문자로 이루어져 있다. 아스키는 숫자 '0~9', 영문자 'A~Z', 'a~z'가 연속적으로 배치되어 있다는 특징이 있으며, 이러한 특징때문에 프로그래밍에서 유용하게 활용된다. 확장 아스키(Extended ASCII) 일반적으로 데이터는 byte 단위로 다..
[regex] 정규 표현식 기호 정리 * 바로 앞에 있는 문자, 하위 표현식, 대괄호로 묶인 문자들이 0번 이상 나타남 a*b* # 일치하는 문자열 예제 : aaaaaaaa, aaabbbbb, bbbbb​ + 바로 앞에 있는 문자, 하위 표현식, 대괄호로 묶인 문자들이 1번 이상 나타남 a+b+ # # 일치하는 문자열 예제 : aaaaaaaab, aaabbbbb, abbbbbb [] 대괄호 안에 있는 문자 중 하나가 나타남 [A-Z]* # 일치하는 문자열 예제 : APPLE, CAPITALS, QWERTY () 그룹으로 묶인 하위 표현식. 정규 표현식을 평가할 때에는 하위 표현식이 가장 먼저 평가됨 (a*b)* # 일치하는 문자열 예제 : aaabaab, abaaab, ababaaaaab {m, n} 바로 앞에 있는 문자, 하위 표현식, 대..
[regex] Remove text between brackets 대괄호, 소괄호 사이에 있는 문자들을 제거하려면 다음과 같이 입력하면 된다. # (), [] 및 사이 단어들 제거 pattern = '[\(\[].*?[\)\]]' text = re.sub(pattern, repl='', string=text)
[intelliJ] 자주 쓰는 단축키 sout System.out.println();​ psvm public static void main(String[] args) { }​ iter for (String arg : args) { }​ fori for (int i = 0; i < ; i++) { }​ ctrl + shift + t : 테스트 만들기
아스키코드와 유니코드 아스키코드(ASCII Code) 컴퓨터에서 보통 영문 위주의 문자를 표현할 때는 아스키 코드를 사용한다. American Standard Code for Information Interchange의 약어로, ASCII라고 부른다. 즉, 아스키코드란 미국정보교환표준부호로 컴퓨터와 통신 장비를 비롯한 문자를 사용하는 많은 장치에서 사용된다. 또한 대부분의 문자 인코딩이 아스키에 기초를 두고 있다. 아스키 코드는 1 바이트(Byte)의 문자를 표현한다. 1 바이트는 2의 8승, 즉 256개의 문자를 표현할 수 있다. 유니코드(Unicode) 유니코드는 이스케이프 문자(\u)와 16진수 4자리를 이용하여 문자를 표현한다. 이는 아스키코드와는 달리 2바이트, 즉 2의 16승인 65536개의 문자를 표현할 수 있다.
LTS와 Current LTS란 Long Term Supported의 축약어로 이 LTS 버전은 서버 환경에서 안정적으로 동작하도록 지원하는 버전이다. 때문에 실제로 서버를 운영할 때에는 안정성과 보안이 중요하므로 LTS 버전을 사용하는 것이 좋다. Current 버전은 말 그대로 최신 기능을 포함한다. LTS 버전에 비해 최신 기능을 포함한다는 것이다. 새로운 기능을 추가하거나 기존 버그들을 우선적으로 수정하여 적용하므로 최신 기능을 사용하고자할 때는 Current 버전을 사용하는 것이 좋다.